具身智能是一种能协助人类完成多种任务的技术,比如照料老年人。本文将详细分析该领域的现状及未来趋势。
具身智能的关键在于机器人是否能真正解决问题,而不是依据L1到L5的分级体系。如今,这个领域正在快速进步,不过敢于大胆预测的人很少,高阳就是少数中的一个。
高阳是清华大学交叉信息研究院的一名助理教授,他在加州大学伯克利分校取得博士学位,并与Pieter Abbeel等人一起完成博士后工作。他现在负责一个名为EVAR Lab的研究小组,专注于设计能让AI赋能机器人的通用方案。他研发的ViLa算法被Figure AI采用。
2024年,高阳与其他伙伴联合创办了千寻智能公司。这家企业因推出类似于中国版的Figure 01而闻名,创立一年就完成了三轮融资,总金额达到2亿元人民币。千寻智能计划在未来十年内让十分之一的人类拥有个人机器人。
在MEET 2025智能未来大会中,高阳博士阐述了他对具身智能的看法,从模型结构、数据处理到行业应用等方面展开了深入讨论。此次会议吸引了大批业内人士参加,现场超过1000人出席,线上观看人数突破320万,受到主流媒体的高度关注。
高阳的主要观点包括:机器人能够辅助人们完成各类任务;AI和机器人技术的进步促进了具身智能的成长;减少对人工数据的依赖至关重要;目前定义的L1至L5等级没有实际价值,短期内只能接近L2.99的水平;预计四年之后能达到类似RobotGPT-3.5的状态,十年后会有10%的人口拥有自己的机器人。
高阳提到,过去一年里具身智能领域的一个重要突破是模型预训练技术的应用。多数大型模型都需要海量数据支持训练,所以如何高效利用网络资源进行预训练成为一个关键议题。例如,Google提出的RT-Trajectory模型运用新方法,借助中间状态引导机器人行动,降低了对人工数据的需求。
高阳强调,确立具身智能标准有助于评估各企业的技术水平。然而,由于现有技术局限,短期内大多数机器人只能停留在L2.99左右。因此,标准应该更侧重于是否能满足用户需求,如机器人在各种环境下的稳定性。
高阳指出,我们现在处于RobotGPT的1.0阶段,尽管现阶段进步较慢,但智能技术的发展速度呈指数级增长。他预测,四年后我们将迈向RobotGPT-3.5阶段,尽管不及预期那么先进,但仍有许多令人惊喜的功能。高阳相信实现这一目标需要时间,但不会太久。
高阳确信,在接下来的十年里,10%的人类将拥有个人机器人。在他看来,这是技术进步的必然结果,也是人类社会发展的重要里程碑。