李飞飞正在尝试用类似ImageNet的方法,推动具身智能的发展。这次她发起的是一项新的挑战赛。最近,由她的团队组织、英伟达参与支持的首届BEHAVIOR家务挑战赛已经启动。他们希望集合学术界和产业界的资源,一起探索机器人完成家务的可能性。参赛者需要使用星海图R1 Pro这款设备,它有双手和轮子,可以在虚拟的家庭环境中完成50项家务任务。
比赛中的任务包括整理房间、做饭、打扫等。选手可以选择自己的算法,官方还提供了一万条专家操作的记录,帮助大家更快上手。比赛分为两个方向:一个要求机器人只能依靠自身看到的信息做决定;另一个则允许机器人获得更详细的数据,比如物体的位置和房间结构。
评分标准包括任务是否完成、部分完成情况、时间、移动距离、机械臂动作次数以及稳定性。最终排名主要看任务完成率。提交截止日期是2025年11月15日,前三名可以获得奖金和硬件奖励。
李飞飞提到,BEHAVIOR的灵感来自ImageNet。2009年,她带领团队发表论文,推动了计算机视觉的发展。当时她并没有想到ImageNet会彻底改变AI领域。她认为ImageNet与神经网络和GPU共同促成了深度学习的兴起。现在,她希望在具身智能领域复制这种模式。
目前,机器人学习面临一些问题,比如缺乏统一的标准、任务分散导致结果难以比较、数据不足等。BEHAVIOR被看作是机器人领域的关键任务,旨在通过社区合作促进技术进步。
这个挑战赛强调以人类为中心,目标是让AI帮助人而不是取代人。所有任务设计都围绕人类需求展开。BEHAVIOR专注于家务,设定了明确的标准。一个真正的家庭机器人需要具备跨房间移动、精细操作、长期计划和适应能力。
比赛规模很大,涵盖1000种家庭活动,有50个完整的任务,每个任务平均需要6.6分钟连续操作。这种以人为本、目标清晰、规模庞大的设计,使BEHAVIOR有望成为下一个ImageNet。
如果ImageNet开启了视觉智能的新时代,那么BEHAVIOR可能是具身智能的开端。越来越多的项目开始关注家务场景,未来可能更多视频内容都是围绕这个主题。大语言模型测试的是答题能力,而具身智能测试的是实际操作能力。趋势已经很明显。