Helix简介

Helix 是 Figure 公司开发的一款通用视觉-语言-动作(VLA)模型,专为服务型人形机器人设计。该模型实现了对机器人上半身(包括手腕、躯干、头部和手指)的高速连续控制,频率可达 200Hz,并支持多机器人协同作业。多个机器人可共享同一组神经网络参数完成任务。Helix 能够基于自然语言指令执行未见过的物体操作,展现出出色的泛化能力。其训练过程采用端到端方式,无需针对特定任务进行微调,且可在低功耗 GPU 上运行,具备良好的商业化应用前景。

Helix的核心功能

  • 全上身控制:实现对机器人上半身各部位的高精度、高频次连续控制,提升动作协调性。
  • 多机器人协作:多个机器人可共用同一神经网络模型,协同完成复杂任务。
  • 自然语言理解与执行:通过自然语言指令完成多种任务,如抓取未知物品或操作家电。
  • 强泛化能力:能够处理多样化的物品,适应不同形状、大小和材质。
  • 商业部署适配:系统优化以适应低功耗嵌入式设备,适合大规模落地应用。

Helix的技术架构

  • 系统2(S2):基于 7B 参数的开源视觉语言模型,负责场景和语言理解,频率为 7-9Hz,用于高层次语义分析。
  • 系统1(S1):基于 80M 参数的 Transformer 架构,负责实时动作控制,频率为 200Hz,快速响应。
  • 端到端训练:从原始图像和自然语言指令直接映射到机器人动作输出,提升模型适应性。
  • 解耦架构:S1 和 S2 在不同时间尺度上运行,S2 处理高级规划,S1 实现快速动作执行。
  • 推理优化:在硬件层面将 S1 和 S2 分离运行,提升系统效率和稳定性。

Helix的应用场景

  • 家庭服务:如整理收纳、家电操作等日常任务。
  • 多机器人协作:多个机器人协同完成搬运或组装任务。
  • 物品抓取:根据自然语言指令抓取陌生物品,适用于物流和仓储。
  • 工业自动化:可用于零部件装配、质量检测等复杂任务。
  • 服务行业:如酒店、餐厅中的引导、递送及清洁服务。

Helix项目信息

  • 项目官网:https://www.figure.ai/news/helix

评论列表 共有 0 条评论

暂无评论

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部