苹果公司近日在一项前沿研究中展示了其在人形机器人训练领域的创新方法。这项技术通过整合人类教练与机器人示范者的协作,为机器人学习提供了更高效、更具成本效益的解决方案。
研究人员指出,传统的人形机器人训练方式存在诸多局限。通常依赖于专门的设备进行数据采集,不仅耗时耗力,还伴随着高昂的成本。这种模式难以大规模推广,限制了机器人技术的发展潜力。
为了解决这些问题,苹果团队提出了一种名为“PH2D”的新方法。该方案利用消费级设备作为训练工具,将普通用户的行为转化为机器人的学习素材。例如,Apple Vision Pro 头显被改造后仅使用左下角摄像头捕捉视觉信息,结合 ARKit 技术获取头部和手部的三维姿态数据。类似地,Meta Quest 头显也经过调整,搭载小型立体摄像头,成为一种经济实惠的训练工具。
在实际操作中,人类教练通过这些设备记录日常动作,如抓取物品、移动物体或倒水等。同时,他们还会提供语音指导,帮助机器人理解任务目标。录制的内容会被放慢处理,以便机器人更好地模仿和学习。
为了进一步提升训练效果,苹果开发了一种名为“Human-humanoid Action Transformer”(HAT)的模型。该模型能够同步处理来自人类和机器人的数据,构建出一个通用的学习框架。相比仅依赖真实机器人数据的方式,这种方法展现出更强的适应性和稳定性。
实验结果显示,在一些具体任务中,比如垂直抓取物体,这种结合训练策略的表现优于单一来源的数据训练。这表明,通过多源信息融合,机器人可以更快地掌握复杂技能。
目前,苹果尚未公开完整的机器人产品,但已有迹象表明,该公司正在探索面向消费者的移动机器人应用。这类机器人有望承担家务和基础服务任务,进一步融入日常生活。
这一技术突破不仅推动了人形机器人领域的发展,也为未来智能设备的普及提供了新的可能性。