虚拟现实 - 智狐AI导航

EDTalk

EDTalk是一款基于音频驱动的唇部同步模型，支持嘴型、头部姿态及情感表情的独立操控。用户可通过上传图片、音频和参考视频生成具有唇形同步和情感表达的动态人脸视频，广泛应用于教育、影视后期、虚拟现实等领域。其高效解耦机制和轻量化设计使其易于操作且资源友好。

AI项目与工具 2025年06月12日 93 点赞 0 评论 336 浏览

MVGenMaster

MVGenMaster是一款基于多视图扩散模型的工具，利用增强的3D先验技术实现新视角合成任务。它可以从单一图像生成多达100个新视图，具有高度的灵活性和泛化能力。模型结合了度量深度、相机姿态扭曲以及全注意力机制等技术，支持高效的前向传播过程，同时兼容大规模数据集。MVGenMaster在视频游戏、电影特效、虚拟现实、3D建模及建筑可视化等领域具有广泛应用前景。

AI项目与工具 2025年06月12日 65 点赞 0 评论 337 浏览

GenXD

GenXD是一款由新加坡国立大学与微软联合开发的3D-4D联合生成框架，能够从任意数量的条件图像生成高质量的3D和4D场景。它通过数据整理流程提取相机姿态和物体运动信息，基于多视角时序模块分离相机与物体运动，并借助掩码潜在条件支持多种视角生成。GenXD支持3D场景重建、动态场景生成以及3D和4D数据融合，适用于视频游戏开发、电影制作、虚拟现实、建筑规划等多个领域。

AI项目与工具 2025年06月12日 54 点赞 0 评论 338 浏览

OmniBooth

OmniBooth是一款由华为诺亚方舟实验室与香港科技大学联合开发的图像生成框架，支持基于文本或图像的多模态指令控制及实例级定制。它通过高维潜在控制信号实现对图像中对象位置和属性的精准操控，具备多模态嵌入提取、空间变形技术以及特征对齐网络等功能，广泛应用于数据集生成、内容创作、游戏开发、虚拟现实及广告营销等领域。

AI项目与工具 2025年06月12日 46 点赞 0 评论 339 浏览

RAG

RAG-Diffusion是一种区域感知型文本到图像生成工具，采用区域硬绑定与区域软细化两阶段策略，实现对图像区域的精确控制与细节优化。该工具支持图像重绘，无需额外内绘模型，且具备免微调特性。其主要应用场景包括数字艺术创作、广告设计、游戏开发及影视制作等领域，能够显著提升工作效率并满足个性化需求。

AI项目与工具 2025年06月12日 48 点赞 0 评论 339 浏览

DeepMesh

DeepMesh是由清华大学和南洋理工大学研发的3D网格生成框架，结合强化学习与自回归变换器技术，实现高质量、高精度的3D模型生成。支持点云和图像条件输入，具备高效的预训练策略与人类偏好对齐机制，适用于虚拟环境、角色动画、医学模拟及工业设计等多个领域。

AI项目与工具 2025年06月12日 98 点赞 0 评论 339 浏览

思腾合力

行业领先的人工智能基础架构解决方案商

创作工具 1970年01月01日 0 点赞 0 评论 348 浏览

DynamicFace

DynamicFace是由小红书团队开发的视频换脸技术，结合扩散模型与时间注意力机制，基于3D面部先验知识实现高质量、一致性的换脸效果。通过四种精细的面部条件分解和身份注入模块，确保换脸后的人脸在不同表情和姿态下保持一致性。该技术适用于视频与图像换脸，广泛应用于影视制作、虚拟现实、社交媒体等内容创作领域，具备高分辨率生成能力和良好的时间连贯性。

AI项目与工具 2025年06月12日 84 点赞 0 评论 357 浏览

ImageBind

ImageBind是由Meta公司开发的开源多模态AI模型，能够整合文本、音频、视觉、温度和运动数据等多种模态的信息，并将其统一到一个嵌入空间中。该模型通过图像模态实现其他模态数据的隐式对齐，支持跨模态检索和零样本学习。它在增强现实（AR）、虚拟现实（VR）、内容推荐系统、自动标注和元数据生成等领域有广泛应用。

AI项目与工具 2025年06月12日 16 点赞 0 评论 361 浏览

xAR

xAR是由字节跳动与约翰·霍普金斯大学联合研发的自回归视觉生成框架，采用“下一个X预测”和“噪声上下文学习”技术，提升视觉生成的准确性和效率。其支持多种预测单元，具备高性能生成能力，在ImageNet数据集上表现优异，适用于艺术创作、虚拟场景生成、老照片修复、视频内容生成及数据增强等多种应用场景。

AI项目与工具 2025年06月12日 30 点赞 0 评论 367 浏览

虚拟现实

首页

虚拟现实

列表

默认

浏览次数

发布日期