Figure突破性进展：机器人VLA模型Helix发布！

投稿
APP
微信扫一扫获取更多

Figure突破性进展：机器人VLA模型Helix发布！

青年汇聚

2025-02-23 22:13:06

图灵汇官网

2025年2月21日，美国的人形机器人创业公司Figure推出了最新研发成果——Helix。这款创新的视觉-语言-动作（VLA）模型致力于推动机器人在家用场景中的普及。

Helix结合了视觉识别、语言理解和动作操控，使人形机器人具备了前所未有的高精度控制能力，特别是在双机协作时表现尤为突出。相比以往的技术，Helix实现了低能耗和无需针对具体任务调整的通用型行为管理，大幅降低了对专业编程的需求。

另外，Helix采用了一种特别的“双系统”设计，超越了当前机器人系统的速度与适用范围限制，开启了具身智能发展的新纪元。

Helix的技术亮点

机器人智慧的升级

Helix的关键创新在于首次引入了“系统1+系统2”的结构。

系统1（S1）：这是个高速视觉运动规划器，运行频率可达200Hz，可快速把系统2提供的语义信息转换成精准的动作指令。S1专注于即时控制与响应，确保机器人能迅速应对环境变动，在合作任务中表现出色。

系统2（S2）：这是一个基于大型预训练的视觉-语言模型（VLM），以较低速率（7-9Hz）运作，主要用于解读场景、分析语言并制定高层次目标。S2为机器人提供宏观语义指引，助其作出决策。

此分离式架构让各系统按最优节奏运作，解决了传统机器人系统在速度与泛化性能间的平衡难题。系统1关注即时反馈，系统2侧重深层考量与抉择，二者协作无间，极大提高了机器人完成任务的灵活性与准确性。

多机器人协作的进步

Helix还支持多台机器人协同作业。过去，机器人协作往往需要复杂的协调机制和任务分配流程，而Helix能让两台机器人共享同一模型，在相同任务中协同配合。

这种能力不仅涵盖基本操作，还涉及复杂的物体拾取与递送任务。比如，两台机器人可以相互传递物件，或是共同完成需多台设备参与的任务。这项功能为未来的机器人集群应用打下了基础，尤其是在家庭内，多个机器人可根据需求灵活分工，共同处理复杂的家务事务，显著提升了机器人实用价值。

Helix还强化了机器人抓取物体的功能。配备Helix的Figure机器人可通过自然语言命令抓取各类小件物品，即便这些物品未曾接触过。这突破了传统机器人只能应对已知物品的局限，使其能在更复杂多变的家庭环境中执行任务。

借助自然语言指令，机器人无需提前学习特定物品的辨识或抓取技巧，而是能够实时依据环境变化灵活应对，这对机器人在开放环境下的应用提供了极大便利。

Helix的应用展望

具身智能商业化的开端

Helix的推出标志着Figure在技术和商业化道路上取得了重要进展。Helix的低能耗、高性能以及无需针对每项任务微调的特点，使其易于在较低成本下投入市场使用。其小型化设计允许Helix在嵌入式低功耗GPU上运行，适合多种场合，包括家庭、办公室和工业领域。

家庭始终是机器人技术的一大挑战。与工业环境不同，家庭里的物品种类繁多，空间布局千差万别，任务难度也更高。Helix能根据自然语言指令执行任务，显著增强了机器人的适应力与灵活性，使其在家用场景中的应用前景十分广阔。例如，机器人可以帮助家庭成员打扫卫生、整理物品，甚至制作餐食等复杂活动。这种多样化的执行能力，使Helix有可能成为智能家居自动化的关键推手。

Helix的另一大优势是其经济实惠的商业化潜力。Helix模型的训练仅需少量优质数据，并且经过一次训练就能实现广泛适用，避免了传统机器人技术中大量人工介入的情况。这不仅让Helix在技术层面更具竞争力，也在成本方面占据明显优势。Figure提到，Helix能在低功耗GPU上运行，这为其大规模推广创造了条件。

未来，随着技术持续进步，Helix将在更多商业领域找到应用机会，进而推动机器人行业的蓬勃发展。按照Figure的规划，未来四年公司将生产10万台人形机器人，象征着从科研实验迈向日常生活应用的商业化转型。若此目标达成，意味着Helix将成为具身智能领域的重要技术代表，对家庭、医疗、安保等行业带来深远影响。

随着技术的日益完善，机器人不仅能承担重复性工作，还将逐渐掌握处理复杂动态任务的能力，重新定义我们的家庭生活与工作环境。