马斯克：现实世界中用于训练 AI 模型的数据已经所剩无几_图灵汇

投稿
APP
微信扫一扫获取更多

马斯克：现实世界中用于训练 AI 模型的数据已经所剩无几

李祉乐

2025-01-10 08:33:03

图灵汇官网

核心提示

据图灵汇报道，马斯克和一些人工智能领域的专家指出，目前AI模型训练所需的数据资源正在逐渐耗尽。在一次直播讨论中，马斯克提到：“我们几乎用尽了所有能用于AI训练的人类知识数据，这种情况大概从一年前开始显现。”

这一观点得到了前OpenAI首席科学家伊利亚·苏茨克弗的认同。他在去年的NeurIPS会议中提到，AI行业正面临“数据瓶颈”的问题，未来可能需要寻找新的训练数据来源，这或许会推动AI开发模式的变革。

合成数据崭露头角

马斯克认为，合成数据或许是解决这一难题的有效途径。他解释道：“唯一可行的办法是借助合成数据，让AI自己创造训练素材。通过不断自我评估和学习，AI的能力可以持续提升。”

像微软、Meta、OpenAI以及Anthropic这样的大型科技公司，已经开始采用合成数据来训练关键的AI模型。根据Gartner的预测，到2024年，超过半数用于AI和数据分析项目的数据将由合成方式生成。

经济优势与挑战并存

合成数据的一大好处是能有效节省开支。例如，一家名为Writer的人工智能初创公司表示，他们研发的Palmyra X 004模型几乎全靠合成数据完成，总成本仅为70万美元。而类似规模的OpenAI模型开发费用则高达460万美元。

不过，合成数据也存在一定的隐患。研究表明，如果合成数据本身带有偏差或局限性，可能会使模型表现变差，甚至得出更加失衡的结果，进而影响其实际应用价值。因此，如何保障合成数据的质量和广泛性，已成为亟需解决的重要课题。

马斯克所剩无几模型用于现实训练已经数据世界 AI

本文来源：互联网文章作者：李祉乐

: 济源低空经济实施方案出炉
图灵汇

: 漳州城兴城乡绿色发展母基金招GP
图灵汇

: 高端磷化铟光芯片厂商「晶耀芯辉半导体」完成种子轮融资
图灵汇

: 清华00后团队成立的「零次方机器人」完成数千万元天使轮融资
图灵汇

: 乐享科技完成近2亿元天使轮融资，IDG资本领投
图灵汇

: 阿里巴巴，投出 AI 视频生成赛道最大单笔融资
图灵汇

: 高瓴、智元等机构押注，具身大脑公司星源智完成 2 亿元天使轮融资
图灵汇

: 贵州茅台跨界入股，合成生物企业康维健完成 B 轮融资
图灵汇

: 具身智能关节厂商「灵足时代」连续完成 Pre-A&Pre-A+ 千万元融资，红杉种子领投
图灵汇

: 对话速腾聚创杨先声：激光雷达点亮「机器人之眼」，割草机器人率先爆发
图灵汇

下一篇

周鸿祎：人工智能大模型正在引领新一轮工业革命

李祉乐

2025-01-17

97