三个月前,MiracleVision在绘画领域仍处于基础阶段。然而,经过迭代升级,其3.0版本现已能够绘制出精细且逼真的图像细节。在6月19日美图公司正式发布视觉大模型MiracleVision之后,于10月9日的美图15周年庆典上,创始人、董事长兼首席执行官吴欣鸿宣布了这一升级成果。
在活动中,吴欣鸿将自己15岁时的画作与MiracleVision最新生成的作品进行了对比,他指出AI与人类在学习艺术上的相似之处,通过广泛吸收不同的绘画风格和技术,AI能够创造出具有独特性的原创作品。展望未来,吴欣鸿认为视觉大模型的应用将经历三个阶段:2024年前为探索期,随后的2024至2025年为高速成长期,直至2026至2030年达到成熟期。随着视觉大模型在生产领域的应用日益成熟,它们将极大地推动设计场景的创新,促进美学的提升与社会经济的增长。
当前,AI视觉大模型在生产端面临的主要挑战包括垂直领域内的极致效果、工作流程整合以及商业模式的构建。但随着与生产端的不断磨合,这些问题将逐步得到解决。对于AI视觉大模型的本质,吴欣鸿将其比作一个无限的视觉创意库,而应用层则像一个内容提取器,根据用户需求从中汲取所需元素,使其在特定场景下发挥作用。
MiracleVision3.0版本引入了“提示词智能联想”等新功能,降低了用户的使用门槛,同时提供了“提示词精准控制”的选项,以满足更高级别的设计需求。该版本还配备了“深化创作”、“AI画面扩展”、“局部修改”、“分辨率提升”等专业功能。
美图将MiracleVision的核心能力拆分为“奇思妙想”和“智能创作”。在“奇思妙想”层面,通过“提示词智能联想”,用户只需输入关键词,系统便能自动补充相关信息,如光影、质感、风格和图片质量,从而推动创作的平等化。而“提示词精准控制”功能允许用户通过特定描述(如“近景”、“顺光”)精确控制生成效果。
在“智能创作”层面,MiracleVision通过“深化创作”功能增加作品的细节和表现力,“AI画面扩展”功能则使作品尺寸更大,细节更丰富,“局部修改”功能允许用户对画面进行精确调整,“分辨率提升”功能则生成高质量的大图,增强细节表现、色彩展现和物体识别。
MiracleVision3.0的应用范围广泛,预计将全面应用于美图旗下的影像与设计产品。此外,该模型还将应用于电商、广告、游戏、动漫和影视五大行业,旨在提升工作流程效率。在电商领域,从概念生成到物料输出,整个过程均可借助MiracleVision完成;在广告领域,从创意构思到物料制作,全过程都能获得提速。在游戏领域,它覆盖了场景、角色、道具、UI图标和宣发物料的设计流程,不仅激发创意,还能降低成本。在动漫领域,从概念设计到物料成品的快速落地,整个流程均得到优化。在影视领域,它能够满足从概念场景设计到宣发物料制作的所有需求,显著提高设计环节的工作效率。