2023年9月7日至9日,上海黄浦区世博园区迎来了外滩大会,这是一场聚焦金融科技与前沿科技的盛会。与会者们围绕着大语言模型展开了深入讨论。
在会议期间,蚂蚁集团副总裁徐鹏分享了集团在大语言模型领域的探索与实践。他指出,大语言模型正展现出日益重要的作用,而蚂蚁集团作为人工智能领域的先行者,致力于通过这些模型为世界带来积极变化。
蚂蚁集团,作为知名的金融科技企业,其金融根基源于旗下支付宝平台。同时,其科技实力体现在对技术研发的大量投入上。2022年,蚂蚁集团的研发支出高达约204.6亿元人民币,拥有18,678项专利,其中绝大多数为发明专利。
蚂蚁集团在开源社区中扮演着活跃角色,至2022年底,已贡献超过300个项目,涵盖了1,500个开源代码库,参与贡献者超过6,000名。这展示了蚂蚁集团在开源技术领域的强大实力和持续投入。
2021年4月,蚂蚁集团成立蚂蚁技术研究院,旨在强化技术探索和创新。该研究院专注于前沿科技的研究,并致力于开发实用、具有创新性的科研成果。其中,交互智能实验室重点研究计算机视觉和自然语言处理技术,如内容生成、多模态理解、数字人技术等。
蚂蚁集团在AI领域的持续投资,使其能够将AI技术应用于营销服务、风控、理财等业务场景,显著提升效率与用户体验。
蚂蚁集团通过AI在多个领域建立了独特能力,包括自然语言处理、多模态学习、知识图谱、图机器学习及运筹优化等,这些能力显著增强了业务场景的价值。
面对生成式AI技术的兴起,特别是以ChatGPT为代表的技术潮流,蚂蚁集团制定了AIGC模型战略。这一战略旨在提升模型的研发效率和先进性,构建可持续发展的研发模式和开放共赢的应用生态。蚂蚁集团已发布基础大模型,包括语言大模型与多模态大模型,并将其应用于金融、安全、医疗等多行业场景。
蚂蚁集团在构建数据和训练模型的基础平台的同时,还自主研发了基础大语言模型,采用Transformer技术,支持并行训练和推理。通过量化、减枝和蒸馏等手段优化模型大小,减少资源消耗。此外,蚂蚁集团还构建了AIGC模型的安全防护体系和评价体系,确保模型的稳定运行和持续优化。
蚂蚁集团计划将AIGC模型应用到B端产业,如辅助文档处理、视频内容分析、遥感影像处理等。在C端场景,探索通过趣味互动增强用户体验。
在大会上,蚂蚁集团推出了基于基础大模型的金融大模型,以及代码生成模型CodeFuse。金融大模型在金融专属任务中表现出色,而CodeFuse则提供智能代码生成、优化等服务,显著提升了研发效率。
蚂蚁集团将继续深化AI技术在数据标注、模型算法、多模态融合、评测体系和安全能力等领域的探索,推动大模型技术在金融、民生、科技服务等领域的广泛应用。同时,积极参与行业标准建设,促进大模型技术的普及与发展。
通过此次大会的分享与发布,蚂蚁集团展示了其在AI领域的深厚积累与前瞻布局,预示着其在大语言模型技术应用与创新方面的持续进步。