Helix

简介：Helix 是 Figure 公司推出的视觉-语言-动作（VLA）模型，专为人形机器人设计，支持对上半身的高精度、高频次控制，频率达 200Hz。它能基于自然语言指令执行未见过的物品操作，具备强大的泛化能力。系统采用端到端训练方式，可在低功耗设备上运行，适用于多机器人协作、家庭服务、工业自动化等多种场景，具有较高的商业化潜力。

AI小编 804 阅读 0 评论 69 点赞

官网地址

Helix简介

Helix 是 Figure 公司开发的一款通用视觉-语言-动作（VLA）模型，专为服务型人形机器人设计。该模型实现了对机器人上半身（包括手腕、躯干、头部和手指）的高速连续控制，频率可达 200Hz，并支持多机器人协同作业。多个机器人可共享同一组神经网络参数完成任务。Helix 能够基于自然语言指令执行未见过的物体操作，展现出出色的泛化能力。其训练过程采用端到端方式，无需针对特定任务进行微调，且可在低功耗 GPU 上运行，具备良好的商业化应用前景。

Helix的核心功能

全上身控制：实现对机器人上半身各部位的高精度、高频次连续控制，提升动作协调性。
多机器人协作：多个机器人可共用同一神经网络模型，协同完成复杂任务。
自然语言理解与执行：通过自然语言指令完成多种任务，如抓取未知物品或操作家电。
强泛化能力：能够处理多样化的物品，适应不同形状、大小和材质。
商业部署适配：系统优化以适应低功耗嵌入式设备，适合大规模落地应用。

Helix的技术架构

系统2（S2）：基于 7B 参数的开源视觉语言模型，负责场景和语言理解，频率为 7-9Hz，用于高层次语义分析。
系统1（S1）：基于 80M 参数的 Transformer 架构，负责实时动作控制，频率为 200Hz，快速响应。
端到端训练：从原始图像和自然语言指令直接映射到机器人动作输出，提升模型适应性。
解耦架构：S1 和 S2 在不同时间尺度上运行，S2 处理高级规划，S1 实现快速动作执行。
推理优化：在硬件层面将 S1 和 S2 分离运行，提升系统效率和稳定性。

Helix的应用场景

家庭服务：如整理收纳、家电操作等日常任务。
多机器人协作：多个机器人协同完成搬运或组装任务。
物品抓取：根据自然语言指令抓取陌生物品，适用于物流和仓储。
工业自动化：可用于零部件装配、质量检测等复杂任务。
服务行业：如酒店、餐厅中的引导、递送及清洁服务。

Helix项目信息

项目官网：https://www.figure.ai/news/helix

本文分类：AI项目与工具
本文标签：AI机器人视觉语言模型 VLA 多机器人协作自然语言指令工业自动化家庭服务端到端训练人形机器人智能控制
浏览次数：804 次浏览
发布日期：2025-06-12 00:00:00
本文链接：https://sihangdaima.com/AIxiangmuyugongju/8817.html

评论列表共有 0 条评论

暂无评论