SpatialVLA是由上海AI Lab、中国电信人工智能研究院及上海科技大学等机构联合研发的新型空间具身通用操作模型。该模型基于大量真实数据进行预训练,具备强大的3D空间理解能力,能够支持机器人在复杂环境中执行多样化任务。

SpatialVLA通过Ego3D位置编码技术,将深度信息与语义特征融合,构建以机器人为中心的3D坐标系,从而提升对空间结构的理解能力。同时,其自适应动作网格机制将连续动作离散化,实现跨平台的动作泛化和迁移。此外,SpatialVLA支持灵活的微调策略,使模型能够快速适应新的机器人平台或任务场景。

该模型已在多个实际应用场景中展现出优异性能,包括工业制造、物流仓储、服务行业、医疗辅助等领域。其开源特性也为相关研究提供了有力支持。

评论列表 共有 0 条评论

暂无评论

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部