机器之心发布的Deepseek V3让国产MoE大模型迅速吸引了全球目光,也让中国在AI领域占据了领先地位。作为中国具身智能的代表企业,智元在2024年底带来了一项重要成果——携手上海人工智能实验室等多家机构,推出了开源项目AgiBot World。这标志着具身智能迈入了一个全新阶段。
AgiBot World是一个汇聚了数百万机器人真实数据的开源集合。在这个数据集中,机器人不仅能够完成简单的桌面任务,还能深度融入日常生活。机器人与人类共同生活的时代正在到来。
展望未来的机器人应用,2024年的你心中,理想的机器人会是什么模样?它们会成为家里的“家务助手”,负责洗衣服和做饭吗?还是在超市里帮忙拣货、收银或整理货架?抑或是工厂里的“全能工”,持续不断地搬运和包装物品?这些过去只出现在科幻电影中的画面,如今正逐步变成现实!
欢迎来到AgiBot World,这里汇集了数百万机器人的真实数据,是具身智能研究的关键资源。它有望推动机器人应用向更实用的方向发展,摆脱传统“虚拟角色”的局限。
AgiBot World的开源链接: - HuggingFace: https://huggingface.co/agibot-world - Github: https://github.com/OpenDriveLab/agibot-world - 官网: https://agibot-world.com/
借助AgiBot World,机器人操控变得更加精细。例如,机器人能够优雅地插花,动作流畅自然,抓取花材时也非常轻柔。
机器人不仅能插花,还能高效完成其他日常任务。比如,它可以轻松刷马桶,再也不用家人轮流来做了。
相比谷歌的Open X-Embodiment数据集,谷歌通过整合多种机器人数据构建的这个数据集由于缺乏统一采集流程,导致数据质量和格式差异较大,可能会影响机器人的学习效果。而斯坦福、伯克利和谷歌等机构开发的DROID数据集虽包含丰富场景和技能,但也存在大量低质量数据,给机器人学习造成障碍。相比之下,一些初创公司基于高质量自采数据训练的模型展现了强大的执行能力,进一步验证了高质量数据的重要性。
为了促进通用具身智能的发展,智元机器人联合上海人工智能实验室、国家地方共建人形机器人创新中心以及上海库帕思,推出了全球首个基于真实场景、全能硬件平台和全程质量控制的百万真机数据集——AgiBot World。这一开创性的项目旨在打造国际领先的开源技术基础,标志着具身智能进入了新纪元。通过整合顶级资源和技术力量,各方将共同推进具身智能的进步,助力人类迈向通用人工智能的新时代。
AgiBot World相比Google的Open X-Embodiment数据集,数据量大出10倍,场景覆盖范围广达100倍,数据质量达到工业级标准。
AgiBot World数据集涵盖了八十余种日常生活技能,从基础操作如抓取、放置、推拉,到复杂精细操作如搅拌、折叠、熨烫等,几乎涵盖了日常生活中所需的绝大部分动作。
AgiBot World数据集来源于智元自建的大规模数据采集工厂与应用实验基地,总面积超过4000平方米,包含3000多种真实物品,真实还原了家居、餐饮、工业、商超和办公五大核心场景。这些场景全面满足了机器人在生产与生活中的典型应用需求,为机器人提供了高度真实的运行环境。
家居场景:真实再现住宅布局,包括卧室、客厅、厨房、卫生间等主要空间,可以实现家务清洁、物品整理和厨房任务等。 超市场景:高度还原超市货架布局与收银区设计,包含生鲜、日用、冷冻等多个品类区域,可以模拟物品上架、货物盘点、顾客引导、无人结算等。 餐厅场景:模拟前厅、后厨与用餐区域,包括点餐台、备餐区、餐桌等,可以实现餐厅服务(点餐、上菜、清理餐桌)、食材传递、后厨协作等。 工业场景:模拟分拣与物流自动化,复刻工业仓库与生产线,包括分拣系统、打包设备、传输带等,可以实现物料分拣、包装打包、物流搬运等。
客厅:机器人可以用工具进行全面清扫,地面的碎屑、灰尘和液体都能被清除干净。 电视:机器人可以使用掸子除尘,或者用软布擦拭桌面污渍,同时保护表面不受损伤。 厨房:机器人可以轻松切菜、拌料、装盘,也能清洗瓶子和碗盘。 超市:机器人可以精准扫描商品并结算,还提供装袋服务。 工厂:机器人在流水线上利用机械臂将物品放入指定包装盒中,实现自动打包。
AgiBot World包含超过100种真实场景,按家居(40%)、餐饮(20%)、工业(20%)、商超(10%)和办公(10%)的比例分布。此外,80%的任务为长时任务,时长多在60秒至150秒之间,且包含多个子技能,是DROID和OpenX-Embodiment工作的5倍。该数据集包含3000多种物品,基本覆盖了这五大场景,并且还在不断扩充和完善中。