ChatAnyone是由阿里巴巴通义实验室研发的实时风格化肖像视频生成框架。该工具通过音频输入,生成包含丰富表情和上半身动作的高质量肖像视频。其核心技术包括高效分层运动扩散模型和混合控制融合生成模型,能够实现高保真度与自然流畅的动画效果,并支持实时交互。用户可对表情风格进行个性化调整,满足多样化需求。该系统适用于虚拟主播、视频会议、内容创作、教育、客户服务、营销及社交娱乐等多个领域。此外,ChatAnyone具备良好的扩展性,可在4090 GPU上以512×768分辨率、30帧/秒的速度实现实时上半身视频生成。
发表评论 取消回复