VR - 智狐AI导航

SAM 2.1

SAM 2.1是一款由Meta开发的先进视觉分割模型，支持图像和视频的实时分割处理。其核心功能包括用户交互式分割、多对象跟踪、数据增强以及遮挡处理等。通过引入Transformer架构和流式记忆机制，SAM 2.1显著提升了对复杂场景的理解能力。该工具具有广泛的应用场景，涵盖内容创作、医疗影像分析、自动驾驶等多个领域。

AI项目与工具 2025年06月12日 49 点赞 0 评论 998 浏览

Zero123

一种从单个图像到一致的多视图扩散基础模型，旨在使用单视图输入生成 3D 一致的多视图图像。

Ai开源项目 2025年06月05日 19 点赞 0 评论 919 浏览

Motion Dreamer

Motion Dreamer是由香港科技大学（广州）研发的视频生成框架，采用两阶段架构生成物理合理的视频内容。通过引入“实例流”实现从稀疏到密集的运动控制，支持用户以少量提示生成时间连贯的视频。其随机掩码训练策略增强了模型的推理能力与泛化性能，已在多个数据集上验证其优越性。适用于视频创作、动画制作、VR/AR及自动驾驶等多个领域。

AI项目与工具 2025年06月12日 12 点赞 0 评论 910 浏览

Vmotionize

一个领先的AI动画生成平台，能够将视频、音乐、文本和图像轻松转换为令人惊叹的3D动画。Vmotionize可以从任何媒体中有效捕捉角色动作，并将其转化逼真的运动动画。

3D&游戏 2025年06月05日 69 点赞 0 评论 900 浏览

TransPixar

TransPixar是由多所高校及研究机构联合开发的开源文本到视频生成工具，基于扩散变换器（DiT）架构，支持生成包含透明度信息的RGBA视频。该技术通过alpha通道生成、LoRA微调和注意力机制优化，实现高质量、多样化的视频内容生成。适用于影视特效、广告制作、教育演示及虚拟现实等多个领域，为视觉内容创作提供高效解决方案。

AI项目与工具 2025年06月12日 17 点赞 0 评论 893 浏览

Lobe Vidol

Lobe Vidol是一个开源的数字人创作平台，支持用户轻松创建和定制虚拟偶像。它具备流畅的对话交互、背景设定、动作库、角色编辑功能，还支持MMD舞蹈和PMX舞台加载。通过TTS与STT技术，Lobe Vidol实现了语音与文本的双向转换，提供沉浸式用户体验。 ---

AI项目与工具 2025年06月12日 60 点赞 0 评论 872 浏览

HRAvatar

HRAvatar是由清华大学联合IDEA团队推出的单目视频重建技术，能够从普通单目视频中生成高质量、可重光照的3D头像。它采用可学习的形变基和线性蒙皮技术，结合精确的表情编码器和物理渲染模型，实现高精度重建和实时渲染（约155 FPS）。支持材质编辑、跨视角渲染和动画化，适用于数字人、虚拟主播、AR/VR、游戏开发和影视制作等领域。

AI项目与工具 2025年06月11日 43 点赞 0 评论 868 浏览

Multiverse

Multiverse是由Enigma Labs开发的全球首个基于AI生成的多人游戏模型，支持实时交互与动态世界生成，确保玩家视角一致。其核心技术包括联合动作向量和双视角通道堆叠，有效解决多人游戏中的同步难题。模型训练成本低，可在普通PC上运行，且项目全面开源，适用于多人游戏开发、VR/AR、AI训练、教育等多个领域。

AI项目与工具 2025年06月11日 56 点赞 0 评论 839 浏览

UVR5

UVR5，终极人声去除器，使用先进的 AI技术，从音视频提取伴奏，简单易用、无需注册即可使用来获取高质量的伴奏和其他音轨文件。

Ai语音工具 2025年06月05日 96 点赞 0 评论 832 浏览

MoviiGen 1.1

MoviiGen 1.1是由ZulutionAI推出的专注于生成电影级画质视频的AI模型，基于Wan2.1微调而成。它在氛围营造、镜头运动和物体细节保留方面表现优异，支持720P和1080P分辨率，适用于高保真场景和专业电影应用。模型具备提示扩展功能，可优化生成效果，并采用序列并行与环形注意力等技术提升性能。其应用场景包括电影制作、广告、游戏开发、VR/AR及教育等领域。

AI项目与工具 2025年06月11日 53 点赞 0 评论 829 浏览

VR

首页

VR

列表

默认

浏览次数

发布日期