GO-1(Genie Operator-1,智元启元大模型)是智元机器人推出的首个通用具身基座模型。该模型基于Vision-Language-Latent-Action(ViLLA)架构,由多模态大模型(VLM)和混合专家系统(MoE)构成。VLM通过大规模互联网图文数据训练,具备强大的场景感知与语言理解能力;MoE中的隐式规划器(Latent Planner)通过分析大量跨本体及人类操作视频数据,实现通用动作逻辑的掌握;而动作专家(Action Expert)则依托百万级真实机器人数据,提升动作执行的精度与效率。 GO-1具备多项核心功能,包括从人类视频中学习动作知识、在小样本条件下快速泛化、支持多种机器人形态部署、持续进化优化性能以及高效执行复杂任务。其技术原理融合了多模态理解和智能决策机制,适用于零售服务、接待咨询、工业辅助、家庭作业及科研探索等多个场景。
发表评论 取消回复