2025年2月21日,美国的人形机器人创业公司Figure推出了最新研发成果——Helix。这款创新的视觉-语言-动作(VLA)模型致力于推动机器人在家用场景中的普及。
Helix结合了视觉识别、语言理解和动作操控,使人形机器人具备了前所未有的高精度控制能力,特别是在双机协作时表现尤为突出。相比以往的技术,Helix实现了低能耗和无需针对具体任务调整的通用型行为管理,大幅降低了对专业编程的需求。
另外,Helix采用了一种特别的“双系统”设计,超越了当前机器人系统的速度与适用范围限制,开启了具身智能发展的新纪元。
Helix的技术亮点
机器人智慧的升级
Helix的关键创新在于首次引入了“系统1+系统2”的结构。
系统1(S1):这是个高速视觉运动规划器,运行频率可达200Hz,可快速把系统2提供的语义信息转换成精准的动作指令。S1专注于即时控制与响应,确保机器人能迅速应对环境变动,在合作任务中表现出色。
系统2(S2):这是一个基于大型预训练的视觉-语言模型(VLM),以较低速率(7-9Hz)运作,主要用于解读场景、分析语言并制定高层次目标。S2为机器人提供宏观语义指引,助其作出决策。
此分离式架构让各系统按最优节奏运作,解决了传统机器人系统在速度与泛化性能间的平衡难题。系统1关注即时反馈,系统2侧重深层考量与抉择,二者协作无间,极大提高了机器人完成任务的灵活性与准确性。
多机器人协作的进步
Helix还支持多台机器人协同作业。过去,机器人协作往往需要复杂的协调机制和任务分配流程,而Helix能让两台机器人共享同一模型,在相同任务中协同配合。
这种能力不仅涵盖基本操作,还涉及复杂的物体拾取与递送任务。比如,两台机器人可以相互传递物件,或是共同完成需多台设备参与的任务。这项功能为未来的机器人集群应用打下了基础,尤其是在家庭内,多个机器人可根据需求灵活分工,共同处理复杂的家务事务,显著提升了机器人实用价值。
Helix还强化了机器人抓取物体的功能。配备Helix的Figure机器人可通过自然语言命令抓取各类小件物品,即便这些物品未曾接触过。这突破了传统机器人只能应对已知物品的局限,使其能在更复杂多变的家庭环境中执行任务。
借助自然语言指令,机器人无需提前学习特定物品的辨识或抓取技巧,而是能够实时依据环境变化灵活应对,这对机器人在开放环境下的应用提供了极大便利。
Helix的应用展望
具身智能商业化的开端
Helix的推出标志着Figure在技术和商业化道路上取得了重要进展。Helix的低能耗、高性能以及无需针对每项任务微调的特点,使其易于在较低成本下投入市场使用。其小型化设计允许Helix在嵌入式低功耗GPU上运行,适合多种场合,包括家庭、办公室和工业领域。
家庭始终是机器人技术的一大挑战。与工业环境不同,家庭里的物品种类繁多,空间布局千差万别,任务难度也更高。Helix能根据自然语言指令执行任务,显著增强了机器人的适应力与灵活性,使其在家用场景中的应用前景十分广阔。例如,机器人可以帮助家庭成员打扫卫生、整理物品,甚至制作餐食等复杂活动。这种多样化的执行能力,使Helix有可能成为智能家居自动化的关键推手。
Helix的另一大优势是其经济实惠的商业化潜力。Helix模型的训练仅需少量优质数据,并且经过一次训练就能实现广泛适用,避免了传统机器人技术中大量人工介入的情况。这不仅让Helix在技术层面更具竞争力,也在成本方面占据明显优势。Figure提到,Helix能在低功耗GPU上运行,这为其大规模推广创造了条件。
未来,随着技术持续进步,Helix将在更多商业领域找到应用机会,进而推动机器人行业的蓬勃发展。按照Figure的规划,未来四年公司将生产10万台人形机器人,象征着从科研实验迈向日常生活应用的商业化转型。若此目标达成,意味着Helix将成为具身智能领域的重要技术代表,对家庭、医疗、安保等行业带来深远影响。
随着技术的日益完善,机器人不仅能承担重复性工作,还将逐渐掌握处理复杂动态任务的能力,重新定义我们的家庭生活与工作环境。