美图公司吴欣鸿：视觉大模型应用普及将经历三个阶段

投稿
APP
微信扫一扫获取更多

美图公司吴欣鸿：视觉大模型应用普及将经历三个阶段

明月

2023-10-16 00:00:00

三个月前，MiracleVision在绘画领域仍处于基础阶段。然而，经过迭代升级，其3.0版本现已能够绘制出精细且逼真的图像细节。在6月19日美图公司正式发布视觉大模型MiracleVision之后，于10月9日的美图15周年庆典上，创始人、董事长兼首席执行官吴欣鸿宣布了这一升级成果。

在活动中，吴欣鸿将自己15岁时的画作与MiracleVision最新生成的作品进行了对比，他指出AI与人类在学习艺术上的相似之处，通过广泛吸收不同的绘画风格和技术，AI能够创造出具有独特性的原创作品。展望未来，吴欣鸿认为视觉大模型的应用将经历三个阶段：2024年前为探索期，随后的2024至2025年为高速成长期，直至2026至2030年达到成熟期。随着视觉大模型在生产领域的应用日益成熟，它们将极大地推动设计场景的创新，促进美学的提升与社会经济的增长。

当前，AI视觉大模型在生产端面临的主要挑战包括垂直领域内的极致效果、工作流程整合以及商业模式的构建。但随着与生产端的不断磨合，这些问题将逐步得到解决。对于AI视觉大模型的本质，吴欣鸿将其比作一个无限的视觉创意库，而应用层则像一个内容提取器，根据用户需求从中汲取所需元素，使其在特定场景下发挥作用。

MiracleVision3.0版本引入了“提示词智能联想”等新功能，降低了用户的使用门槛，同时提供了“提示词精准控制”的选项，以满足更高级别的设计需求。该版本还配备了“深化创作”、“AI画面扩展”、“局部修改”、“分辨率提升”等专业功能。

美图将MiracleVision的核心能力拆分为“奇思妙想”和“智能创作”。在“奇思妙想”层面，通过“提示词智能联想”，用户只需输入关键词，系统便能自动补充相关信息，如光影、质感、风格和图片质量，从而推动创作的平等化。而“提示词精准控制”功能允许用户通过特定描述（如“近景”、“顺光”）精确控制生成效果。

在“智能创作”层面，MiracleVision通过“深化创作”功能增加作品的细节和表现力，“AI画面扩展”功能则使作品尺寸更大，细节更丰富，“局部修改”功能允许用户对画面进行精确调整，“分辨率提升”功能则生成高质量的大图，增强细节表现、色彩展现和物体识别。

MiracleVision3.0的应用范围广泛，预计将全面应用于美图旗下的影像与设计产品。此外，该模型还将应用于电商、广告、游戏、动漫和影视五大行业，旨在提升工作流程效率。在电商领域，从概念生成到物料输出，整个过程均可借助MiracleVision完成；在广告领域，从创意构思到物料制作，全过程都能获得提速。在游戏领域，它覆盖了场景、角色、道具、UI图标和宣发物料的设计流程，不仅激发创意，还能降低成本。在动漫领域，从概念设计到物料成品的快速落地，整个流程均得到优化。在影视领域，它能够满足从概念场景设计到宣发物料制作的所有需求，显著提高设计环节的工作效率。