TaoAvatar简介
TaoAvatar是由阿里巴巴集团研究团队开发的一种高保真、轻量级的3D全身对话虚拟人技术。该技术基于3D高斯溅射(3DGS)方法,能够生成具有照片级真实感的3D全身虚拟形象,并支持高分辨率渲染,同时保持较低的存储需求。TaoAvatar可在多种移动设备和AR平台上以90帧/秒的高帧率实时运行,通过语音、表情、手势及身体动作等多种输入信号实现口型、表情与动作的自然同步。
TaoAvatar的核心功能
- 高保真全身动态建模:从多视角图像中生成结构一致且逼真的3D全身虚拟形象,支持对姿态、手势和表情的精细控制。
- 高效实时渲染:在多种移动和AR设备上实现90FPS的高帧率渲染,兼顾高质量输出与低存储占用。
- 多模态驱动交互:支持语音、表情、手势和身体姿势等多种信号驱动,实现面部和肢体动作的自然同步。
- 轻量级架构设计:通过将复杂变形“烘焙”至MLP网络中,提升系统运行效率,适用于资源受限环境。
TaoAvatar的技术原理
- 3D高斯溅射技术:采用3D高斯函数表示场景点,结合SfM技术从多视角图像中重建3D点云,并通过优化训练生成高质量渲染结果。
- 姿态依赖非刚性变形处理:将变形分解为刚性和形状部分,利用知识蒸馏技术将形状信息嵌入轻量MLP模型中。
- 可学习的高斯混合形状:通过神经网络学习不同姿态下的高斯参数,提升虚拟形象在多样化状态下的表现。
- 实时渲染优化:采用GPU加速、计算优化等手段,确保在高端显示设备上实现流畅的实时渲染。
TaoAvatar的项目信息
- 项目官网:https://pixelai-team.github.io/TaoAvatar/
- arXiv技术论文:https://arxiv.org/pdf/2503.17032
TaoAvatar的应用领域
- 电商直播:用于构建虚拟主播,提升互动体验并降低运营成本。
- 全息通信:增强远程交流的沉浸感与真实感。
- 虚拟会议:提供个性化虚拟形象,提升远程协作体验。
- 在线教育:通过虚拟人物提升教学趣味性与参与度。
- 虚拟娱乐:在游戏与VR场景中创建高度拟真的角色。
发表评论 取消回复