虚拟现实 - 智狐AI导航

DIAMOND

DIAMOND是一款基于扩散模型的强化学习代理，专注于模拟复杂环境以支持代理的学习与决策。它在Atari游戏和3D环境中表现出色，能够捕捉丰富的视觉信息。通过连续潜在变量和优化的去噪步骤，DIAMOND提升了模型的稳定性和效率。其应用场景涵盖游戏AI开发、机器人技术、虚拟现实、教育培训及科学研究等领域。

AI项目与工具 2025年06月12日 62 点赞 0 评论 740 浏览

Cartwheel 是一款基于文本到动画（Text-to-Motion）技术的 AI 3D 动画生成平台，用户只需输入文本描述即可快速生成高质量的 3D 角色动画。平台结合深度学习与传统动画技术，支持动作捕捉、自动化运动合成，并与主流 3D 软件无缝集成。其功能包括文本驱动动画、可编辑动画、动作库预设等，适用于游戏开发、影视制作、广告营销、VR/AR 及教育等多个场景。Cartwheel 提供不同

AI项目与工具 2025年06月11日 14 点赞 0 评论 739 浏览

Find3D

Find3D是一款由加州理工学院开发的3D部件分割模型，通过自动化数据生成技术和对比学习方法，实现了高效且精准的3D对象分割。它能够在多个数据集上达到三倍于次优方法的性能提升，支持开放世界下的任意文本查询分割，广泛应用于机器人、虚拟现实、建筑设计等领域。

AI项目与工具 2025年06月12日 27 点赞 0 评论 738 浏览

Project Turntable

Project Turntable是一款由Adobe发布的AI工具，支持用户在三维空间中旋转二维矢量图像，并利用生成式AI和深度学习技术即时生成图像的隐藏部分。它显著提升了设计师的工作效率，减少了重复性劳动，适用于平面设计、插画创作、动画制作及游戏开发等领域，同时保持了图像的二维特性和平滑过渡效果。

AI项目与工具 2025年06月12日 92 点赞 0 评论 737 浏览

HourVideo

HourVideo是一项由斯坦福大学研发的长视频理解基准数据集，包含500个第一人称视角视频，涵盖77种日常活动，支持多模态模型的评估。数据集通过总结、感知、视觉推理和导航等任务，测试模型对长时间视频内容的信息识别与综合能力，推动长视频理解技术的发展。其高质量的问题生成流程和多阶段优化机制，使其成为学术研究的重要工具。

AI项目与工具 2025年06月12日 77 点赞 0 评论 736 浏览

HoloTime

HoloTime 是由北京大学深圳研究生院与鹏城实验室联合开发的全景 4D 场景生成框架，可将单张全景图像转化为动态视频，并进一步重建为沉浸式 4D 场景。其核心技术包括全景动画生成器（Panoramic Animator）和时空重建技术，结合 360World 数据集进行训练，实现高质量的视频生成与场景重建。该工具支持 VR/AR 应用，适用于虚拟旅游、影视制作、游戏开发等多个领域，提供高效的沉

AI项目与工具 2025年06月11日 20 点赞 0 评论 734 浏览

Janus

Janus是一种由DeepSeek AI开发的自回归框架，专注于多模态理解和生成任务的统一化。它通过分离视觉编码路径并使用单一Transformer架构来提升灵活性和性能，支持多种输入模态如图像、文本等，并在某些任务中表现出色。Janus具备多模态理解、图像生成及跨模态交互能力，适用于图像创作、自动标注、视觉问答等多个领域。

AI项目与工具 2025年06月12日 45 点赞 0 评论 733 浏览

Move AI

Move AI 是一款基于AI和计算机视觉的无标记动作捕捉工具，可将普通摄像头拍摄的2D视频转换为高精度3D运动数据。支持实时追踪、多摄像头配置及多种格式导出，适用于影视、游戏、体育分析、VR/AR等领域，提供高效、低成本的解决方案。

AI项目与工具 2025年06月12日 35 点赞 0 评论 731 浏览

EMAGE

EMAGE是一款基于音频输入生成全身手势的AI框架，可同步生成面部表情、肢体动作及整体运动。通过掩蔽音频手势变换器和多模块VQ-VAE建模，实现高质量、多样化的手势生成。适用于虚拟现实、动画制作、数字人交互等领域，提升虚拟角色表现力与交互自然度。

AI项目与工具 2025年06月12日 13 点赞 0 评论 730 浏览

GAS

GAS是一种从单张图像生成高质量、视角一致且时间连贯虚拟形象的AI工具，结合3D人体重建与扩散模型技术，支持多视角合成与动态姿态动画。其统一框架提升模型泛化能力，适用于游戏、影视、体育及时尚等领域，具备高保真度与真实感。

AI项目与工具 2025年06月12日 36 点赞 0 评论 728 浏览

虚拟现实

首页

虚拟现实

列表

默认

浏览次数

发布日期