Psi R0

简介：Psi R0是一款基于强化学习的端到端具身模型，支持双灵巧手协同操作，具备多技能串联混训和跨物品、跨场景的泛化能力。通过仿真数据训练及技能优化，Psi R0能在复杂环境中完成长程任务，同时具备自主切换技能的功能，确保高成功率和鲁棒性。主要应用场景包括电商商品打包、工厂产线组装、服务业拣货打包及家居环境清洁整理。

AI小编 859 阅读 0 评论 18 点赞

官网地址

Psi R0是由灵初智能开发的首款基于强化学习的端到端具身模型，专注于实现双灵巧手的高效协同操作。该模型能够串联多种技能，生成具备推理能力的智能体，从而完成复杂的长程灵巧操作任务。Psi R0在跨物品和跨场景层面展现出卓越的泛化能力，并具备高度的鲁棒性。 Psi R0的核心功能包括双灵巧手协同操作、多技能串联混训、跨物品和跨场景的泛化能力以及基于仿真数据的训练。此外，其技能训练框架通过抽象物体时空轨迹构建通用目标函数，有效解决了奖励函数设计的难题。后训练阶段的优化则进一步提升了模型在真实环境中的成功率。模型还具备自主切换技能的能力，能够在操作失败时快速调整策略，确保任务的顺利完成。技术原理方面，Psi R0采用强化学习方法，结合创新的技能训练框架，实现了对双手操作智能体的高效训练。这些技术手段共同推动了模型在开放环境中的长程任务表现。

本文分类：AI项目与工具
本文标签：AI工具强化学习端到端具身模型双灵巧手泛化能力鲁棒性技能训练框架自主切换技能长程任务仿真数据训练
浏览次数：859 次浏览
发布日期：2025-06-12 00:00:00
本文链接：https://sihangdaima.com/AIxiangmuyugongju/9692.html

评论列表共有 0 条评论

暂无评论

Psi R0

评论列表 共有 0 条评论

发表评论 取消回复

评论列表共有 0 条评论

发表评论取消回复