Psi R0是由灵初智能开发的首款基于强化学习的端到端具身模型,专注于实现双灵巧手的高效协同操作。该模型能够串联多种技能,生成具备推理能力的智能体,从而完成复杂的长程灵巧操作任务。Psi R0在跨物品和跨场景层面展现出卓越的泛化能力,并具备高度的鲁棒性。 Psi R0的核心功能包括双灵巧手协同操作、多技能串联混训、跨物品和跨场景的泛化能力以及基于仿真数据的训练。此外,其技能训练框架通过抽象物体时空轨迹构建通用目标函数,有效解决了奖励函数设计的难题。后训练阶段的优化则进一步提升了模型在真实环境中的成功率。模型还具备自主切换技能的能力,能够在操作失败时快速调整策略,确保任务的顺利完成。 技术原理方面,Psi R0采用强化学习方法,结合创新的技能训练框架,实现了对双手操作智能体的高效训练。这些技术手段共同推动了模型在开放环境中的长程任务表现。
发表评论 取消回复