SpatialVLA

简介：SpatialVLA是一款由多机构联合研发的空间具身通用操作模型，具备强大的3D空间理解能力与跨平台泛化控制能力。通过Ego3D位置编码和自适应动作网格技术，实现精准的环境感知与动作生成。支持零样本任务执行与快速微调，适用于工业、物流、医疗等多个领域，推动机器人技术的发展与应用。

AI小编 640 阅读 0 评论 39 点赞

项目地址

SpatialVLA是由上海AI Lab、中国电信人工智能研究院及上海科技大学等机构联合研发的新型空间具身通用操作模型。该模型基于大量真实数据进行预训练，具备强大的3D空间理解能力，能够支持机器人在复杂环境中执行多样化任务。

SpatialVLA通过Ego3D位置编码技术，将深度信息与语义特征融合，构建以机器人为中心的3D坐标系，从而提升对空间结构的理解能力。同时，其自适应动作网格机制将连续动作离散化，实现跨平台的动作泛化和迁移。此外，SpatialVLA支持灵活的微调策略，使模型能够快速适应新的机器人平台或任务场景。

该模型已在多个实际应用场景中展现出优异性能，包括工业制造、物流仓储、服务行业、医疗辅助等领域。其开源特性也为相关研究提供了有力支持。

暂无评论