场景 - 智狐AI导航

GO

GO-1是智元机器人推出的首个通用具身基座模型，采用ViLLA架构，结合多模态大模型与混合专家系统，具备场景感知、动作理解和精细执行能力。支持小样本快速泛化、跨本体部署与持续进化，广泛应用于零售、制造、家庭及科研等领域，推动具身智能技术发展。

AI项目与工具 2025年06月12日 74 点赞 0 评论 522 浏览

子曰翻译2.0

子曰翻译2.0是网易有道推出的最新翻译大模型，通过数据优化、算法升级和严格评估体系，实现翻译质量与效率的显著提升。支持中英互译、专业领域翻译及多场景应用，涵盖学术、医疗、文学等领域，具备高准确性、流畅性和适应性，适用于多种翻译需求。

AI项目与工具 2025年06月12日 93 点赞 0 评论 641 浏览

理想同学网页版

理想同学网页版是一款由理想汽车推出的AI智能助手，集成DeepSeek R1/V3 671B满血版模型，支持多模型切换、联网搜索、图像识别等功能。用户可通过文字、长文本或图片进行交互，支持360°视觉追踪，提升交互体验。适用于办公、学习、多设备协同等场景，支持网页与移动端同步，打造无缝智能服务生态。

AI项目与工具 2025年06月12日 44 点赞 0 评论 497 浏览

MIDI

MIDI是一种基于多实例扩散模型的3D场景生成技术，能将单张2D图像快速转化为高保真度的360度3D场景。它通过智能分割、多实例同步扩散和注意力机制，实现高效的3D建模与细节优化。具有良好的泛化能力，适用于游戏开发、虚拟现实、室内设计及文物数字化等多个领域。

AI项目与工具 2025年06月12日 64 点赞 0 评论 639 浏览

SpatialLM

SpatialLM 是一款由群核科技推出的开源空间理解多模态模型，能通过分析普通手机拍摄的视频生成详细的 3D 场景布局，涵盖房间结构、家具摆放等信息。它结合大语言模型与点云重建技术，实现空间认知与语义标注，并支持低成本数据采集。该模型适用于具身智能训练、AR/VR、建筑设计等多个领域，具备物理规则嵌入和结构化场景生成能力。

AI项目与工具 2025年06月12日 82 点赞 0 评论 392 浏览

Bolt3D

Bolt3D是由谷歌研究院、牛津大学VGG团队与谷歌DeepMind联合开发的3D场景生成技术，基于潜在扩散模型，能在单块GPU上仅需6.25秒生成高质量3D场景。支持多视角输入，具备良好泛化能力，采用高斯溅射技术实现高保真表示，并支持实时交互。适用于游戏开发、VR/AR、建筑设计和影视制作等领域。

AI项目与工具 2025年06月12日 47 点赞 0 评论 767 浏览

ObjectMover

ObjectMover是由香港大学与Adobe Research联合开发的图像编辑模型，专注于解决物体移动、插入和移除过程中的光影协调问题。通过视频先验迁移和序列到序列建模技术，实现对光照、阴影和遮挡关系的精准控制。支持多任务学习，提升模型在真实场景中的适应性。广泛应用于特效制作、虚拟场景编辑、游戏开发等领域，具备高效、真实的图像编辑能力。

AI项目与工具 2025年06月12日 91 点赞 0 评论 467 浏览

Vibe Draw

Vibe Draw是一款开源AI 3D建模工具，能将2D草图自动转换为高质量3D模型，并支持文本提示优化和模型编辑。用户可一键导出为glTF格式，适用于创意设计、教育、游戏开发等多个领域。工具基于Next.js、React、Three.js、FastAPI等技术，具备高效的实时交互与异步处理能力。

AI项目与工具 2025年06月12日 68 点赞 0 评论 511 浏览

Baklib

Baklib是一款企业级数字内容管理平台，通过资源库、知识库和应用库三大模块，实现数字资产全生命周期管理、知识体系构建与多场景内容系统搭建。支持智能检索、AI内容生成、多语言与多渠道分发，提升企业内容管理效率与用户体验。

AI项目与工具 2025年06月12日 11 点赞 0 评论 570 浏览

WorldScore是由斯坦福大学推出的统一世界生成模型评估基准，支持3D、4D、图像到视频（I2V）和文本到视频（T2V）等多种模态。它从可控性、质量和动态性三个维度进行评估，涵盖3000个测试样本，包括静态与动态、室内与室外、逼真与风格化等多种场景。WorldScore具备多场景生成、长序列支持、图像条件生成、多风格适配等功能，适用于图像到视频、图像到3D生成以及自动驾驶场景模拟等应用，为研究

AI项目与工具 2025年06月12日 87 点赞 0 评论 787 浏览

场景

首页

场景

列表

默认

浏览次数

发布日期

GO