RDT

简介：RDT是清华大学AI研究院推出的一款双臂机器人操作任务扩散基础模型，拥有十亿参数量，可自主完成复杂任务，如调酒和遛狗。该模型基于模仿学习，具备强大的泛化能力和操作精度，支持多种模态输入和少样本学习。RDT已在餐饮、家庭、医疗、工业及救援等领域展现广泛应用前景，推动机器人技术发展。

AI小编 901 阅读 0 评论 83 点赞

项目地址

RDT（Robotics Diffusion Transformer）是由清华大学AI研究院TSAIL团队开发的全球规模最大的双臂机器人操作任务扩散基础模型。该模型包含数十亿参数，能够独立完成复杂任务，如调酒和遛狗，展现出卓越的泛化能力和操作精度。RDT通过模仿人类动作实现学习，支持处理未见过的物体和场景。目前，清华团队已开放RDT的代码、模型及训练数据集，以促进机器人技术的进步。 RDT主要通过多模态输入编码、Transformer骨干网络以及预训练与微调机制实现其核心功能。它结合了语言、视觉和动作三种模态，并采用QKNorm、RMSNorm等技术优化，同时具备少样本学习能力，能够在有限演示下快速掌握新技能。此外，RDT还构建了统一的动作空间，以适应不同机器人数据格式的学习需求。 RDT已在多个领域展示了其潜力，包括餐饮服务、家庭助理、医疗辅助、工业自动化及灾难救援等。这些应用场景不仅提高了工作效率，还增强了操作的安全性和灵活性。

本文分类：AI项目与工具
本文标签：机器人操作任务扩散模型泛化能力自主学习多模态输入清华大学餐饮服务家庭助理工业自动化
浏览次数：901 次浏览
发布日期：2025-06-12 00:00:00
本文链接：https://sihangdaima.com/AIxiangmuyugongju/9880.html

评论列表共有 0 条评论

暂无评论

RDT

评论列表 共有 0 条评论

发表评论 取消回复

评论列表共有 0 条评论

发表评论取消回复