11月18日,蚂蚁集团发布了一款名为“灵光”的全模态AI助手。该工具可在手机上通过自然语言快速生成小型应用,并且支持编辑、互动和分享功能。
这款产品是业内首款能生成多模态内容的AI助手,首批推出三个主要功能:“灵光对话”“灵光闪应用”“灵光开眼”。它能够输出3D、音视频、图表、动画、地图等多种形式的信息,提升交流效率和体验感。目前,灵光已上线安卓和苹果的应用商店。
“灵光对话”改变了传统的文字问答方式。它不像以往那样只是堆砌文字,而是像展览一样设计对话内容。借助结构化思维,AI的回答更加有条理、简洁明了。同时,系统可以生成动态3D模型、可交互地图、音视频等,让信息展示更直观。最终以清晰的方式呈现知识,帮助用户快速理解。
这种即时生成、简单又多样化的回答方式,依赖于灵光的多模态输出能力。所有内容,包括图表、动画和小应用,都是根据对话环境实时生成的。此外,灵光采用多智能体协作的架构,能根据需要调用图像、3D、动画等专用工具,为用户提供更全面、丰富的体验。
值得一提的是,灵光推出了“闪应用”功能,允许普通用户在短时间内生成实用的小程序。用户只需输入一句话,系统就能在1分钟内生成应用,最快仅需30秒。例如,健身计划、旅行安排或健康食谱都可以通过一句话完成创建,参数可以自定义,使用后还能直接分享。
如果用户询问“溏心蛋要煮多久”,灵光会生成一个“溏心蛋时间计算器”,用户可以根据鸡蛋大小和熟度进行调整,得到最适合自己的答案。如果用户想了解如何节省养车成本,系统也能生成一个“养车成本计算器”,用户输入里程、油费等数据,即可获得个性化方案。
现在,灵光生成的应用不仅限于静态页面,还能连接后台的大模型,实现与外部系统的实时互动,拓展了更多实际应用场景。
从2025年开始,蚂蚁集团加快了对通用人工智能的布局,已经推出了AI医疗助手AQ,并发展了具身智能技术。灵波科技也逐步成熟。蚂蚁百灵大模型进入万亿参数模型行列。灵光的发布,进一步强化了蚂蚁在通用人工智能领域的技术实力和实际应用能力。