具身智能 - 智狐AI导航

Gemini Robotics

Gemini Robotics 是谷歌 DeepMind 基于 Gemini 2.0 开发的机器人系统，融合视觉-语言-动作模型，支持复杂任务执行与环境适应。具备三维空间理解、物体检测、轨迹预测和开放词汇指令执行能力，适用于工业制造、物流仓储、家庭服务、医疗健康等多个领域。系统通过数据驱动训练，结合真实操作与多模态信息，实现高效、灵活的机器人控制。

AI项目与工具 2025年06月12日 17 点赞 0 评论 820 浏览

GRUtopia 2.0

GRUtopia 2.0是上海人工智能实验室推出的通用具身智能仿真平台，提供模块化框架、场景自动生成与高效数据采集功能。用户可使用“三行代码”快速定义任务，平台内置百万级标准化物体资产，支持复杂场景的一键生成。同时具备大规模3D场景数据集、AI驱动的NPC系统及基准测试平台，适用于机器人训练、社交互动、导航与操作等任务，推动具身智能从仿真走向现实。

AI项目与工具 2025年06月12日 16 点赞 0 评论 788 浏览

TripoSF是由VAST推出的新型3D基础模型，采用SparseFlex表示方法和稀疏体素结构，显著降低内存占用并提升高分辨率建模能力。其“视锥体感知的分区体素训练”策略优化了训练效率，使模型在细节捕捉、拓扑结构支持和实时渲染方面表现突出。实验数据显示，TripoSF在Chamfer Distance和F-score等关键指标上分别降低82%和提升88%。适用于视觉特效、游戏开发、具身智能及产品

AI项目与工具 2025年06月12日 71 点赞 0 评论 788 浏览

MineWorld

MineWorld是由微软研究院开发的基于《我的世界》的实时交互式AI模型，采用视觉-动作自回归Transformer架构，实现高保真、可控性强的场景生成。通过并行解码算法，模型可在每秒4至7帧的速度下实现实时交互，适用于具身智能、强化学习、游戏代理及视频生成等场景。其核心技术包括图像与动作标记器、Transformer解码器以及优化的训练与推理流程。

AI项目与工具 2025年06月11日 93 点赞 0 评论 788 浏览

Genie Studio

Genie Studio 是一款面向具身智能的全链路开发平台，涵盖数据采集、模型训练、仿真评测和部署。支持多模态数据采集、高保真仿真环境、自动化评测及一键真机部署，适用于机器人研发、工业自动化、物流仓储和服务机器人等多种场景，提升开发效率与应用落地速度。

AI项目与工具 2025年06月11日 78 点赞 0 评论 773 浏览

TrackVLA

TrackVLA是银河通用推出的端到端导航大模型，具备纯视觉环境感知、语言指令驱动、自主推理和零样本泛化能力。它能在复杂环境中自主导航、灵活避障，并根据自然语言指令识别和跟踪目标对象。无需提前建图，适用于多种场景，如陪伴服务、安防巡逻、物流配送等，为具身智能商业化提供支撑，推动机器人走向日常生活。

AI项目与工具 2025年06月11日 79 点赞 0 评论 772 浏览

Aether

Aether是由上海AI Lab开发的生成式世界模型，基于合成数据训练，具备4D动态重建、动作条件视频预测和目标导向视觉规划等核心功能。它通过三维时空建模和多任务协同优化，实现对环境的精准感知与智能决策，具有出色的零样本泛化能力，适用于机器人导航、自动驾驶、虚拟现实等多个领域。

AI项目与工具 2025年06月11日 25 点赞 0 评论 767 浏览

AgiBot World

AgiBot World是一个由智元机器人开发的百万真机数据集，专注于具身智能技术的研究。它涵盖了80多种日常生活技能，涉及家居、餐饮、工业、商超及办公五大场景，数据规模和质量均领先于谷歌的Open X-Embodiment。数据采集利用了智元自建的工厂和实验基地，通过8个摄像头和6自由度灵巧手等先进硬件，确保了全域真实场景下的高质量数据获取。项目还计划开源仿真数据、发布具身基座大模型及配套工具链

AI项目与工具 2025年06月12日 10 点赞 0 评论 733 浏览

Scenethesis

Scenethesis是NVIDIA推出的AI框架，可通过文本生成高质量的3D场景。它结合LLM与视觉技术，经过布局规划、视觉细化、物理优化和场景验证四个阶段，确保生成结果具备物理合理性和空间连贯性。支持用户交互与多样化场景构建，广泛应用于VR/AR、游戏开发、具身智能及虚拟内容创作等领域。

AI项目与工具 2025年06月11日 13 点赞 0 评论 725 浏览

Embodied Reasoner

Embodied Reasoner是由多家科研机构联合开发的具身交互推理模型，通过视觉搜索、推理与行动协同完成复杂任务。采用模仿学习、自我探索和自我修正三阶段训练方法，生成多样化思考过程，提升任务规划效率。在长时序任务中表现优异，减少重复搜索和逻辑错误。适用于智能家居、仓储物流、医疗辅助等多个场景，具备多模态交互和强推理能力。

AI项目与工具 2025年06月11日 88 点赞 0 评论 685 浏览

具身智能

首页

具身智能

列表

默认

浏览次数

发布日期