蚂蚁数科李哲:高质量数据将成为AI产业化的重要基础

图灵汇官网

在2024年的发展论坛上,蚂蚁数科的AI技术负责人李哲指出,高质量的数据对AI产业发展至关重要。他提到,AI数据服务大致经历了三个发展阶段:构建数据闭环、实现高效数据标注以及开展多模态数据合成。

在弱人工智能时期,构建数据闭环是核心任务。蚂蚁数科借助自动化工具持续改进算法,增强人脸识别的安全性能。目前,这套系统已被广泛应用于安卓设备的人脸识别安全测试。

到了生成式AI阶段,数据标注的重要性日益凸显。蚂蚁数科凭借自动化的标注技术,为医疗、交通、社交及金融等行业提供专业高效的标注支持,从而帮助AI模型更精准地理解人类知识。

随着AI向通用人工智能(AGI)方向演进,多模态数据合成逐渐成为研究热点。为了提升AI的通用性和适应力,蚂蚁数科结合仿真技术和强化学习手段,生成了大量高质量的边缘数据,例如自动驾驶中的极端气候条件数据和具身智能相关数据。

在数据管理与流通层面,蚂蚁数科开发了名为“DataFab”的数据处理平台,确保数据在可信可控的前提下顺畅流动,大幅提升了大规模模型的训练效率。该平台已在蚂蚁集团内部多个部门投入使用。

另外,蚂蚁数科也在AI安全性领域展开探索。针对人脸识别的安全隐患,蚂蚁天玑实验室携手多家单位制定了国内首个聚焦金融场景的“AI换脸”检测规范。同时,针对大模型可能带来的安全与伦理挑战,蚂蚁数科推出了“蚁鉴”和“天鉴”两项服务,为大模型的实际应用保驾护航。

李哲透露,未来蚂蚁数科会继续深耕AI数据服务及相关技术创新,积极寻求与其他行业伙伴的合作机会,助力AI技术在更多领域的落地与普及。

本文来源: 互联网 文章作者: 胖胖说智能