FantasyTalking

简介：FantasyTalking是一种由阿里巴巴AMAP团队与北京邮电大学联合开发的AI工具，能够从静态肖像生成高质量、可动画化的虚拟形象。该工具采用双阶段视听对齐策略，结合面部专注的交叉注意力模块和运动强度调制模块，实现精准口型同步、丰富表情生成及全身动作控制。支持多种风格和姿态，适用于游戏、影视、VR/AR、虚拟主播及教育等领域。

AI小编 671 阅读 0 评论 83 点赞

项目地址

FantasyTalking是由阿里巴巴AMAP团队与北京邮电大学联合研发的一种新型框架，旨在从单张静态肖像生成高质量、可动画化的虚拟形象。该框架基于预训练的视频扩散变换器模型，采用双阶段视听对齐策略：第一阶段通过片段级训练建立全局运动连贯性，第二阶段利用唇部追踪掩码在帧级别优化唇部动作，确保与音频信号精确同步。同时，框架引入面部专注的交叉注意力模块以保持面部一致性，并通过运动强度调制模块实现对表情和身体动作的可控调节。 FantasyTalking支持多种风格和姿态的虚拟形象生成，包括写实与卡通风格，以及不同视角和身体范围的动态表现。其技术原理涵盖身份保持机制、运动强度调节以及基于预训练模型的高保真视频生成能力，适用于游戏开发、影视制作、虚拟现实、虚拟主播及智能教育等多个领域。

本文分类：AI项目与工具
本文标签：AI生成虚拟形象口型同步面部动作生成全身动画视频扩散模型虚拟主播智能教育姿态生成人工智能应用
浏览次数：671 次浏览
发布日期：2025-06-11 00:00:00
本文链接：https://sihangdaima.com/AIxiangmuyugongju/8197.html

评论列表共有 0 条评论

暂无评论

FantasyTalking

评论列表 共有 0 条评论

发表评论 取消回复

评论列表共有 0 条评论

发表评论取消回复