虚拟主播

ACTalker

ACTalker 是一种基于视频扩散模型的端到端工具,可生成高质量、自然的说话人头部视频。支持多信号控制(如音频、表情),采用并行 Mamba 结构和门控机制,实现跨时间和空间的精准面部动作控制。实验表明其在音频同步性和视频质量上表现优异,适用于虚拟主播、远程会议、在线教育等多种场景。

FantasyTalking

FantasyTalking是一种由阿里巴巴AMAP团队与北京邮电大学联合开发的AI工具,能够从静态肖像生成高质量、可动画化的虚拟形象。该工具采用双阶段视听对齐策略,结合面部专注的交叉注意力模块和运动强度调制模块,实现精准口型同步、丰富表情生成及全身动作控制。支持多种风格和姿态,适用于游戏、影视、VR/AR、虚拟主播及教育等领域。

HRAvatar

HRAvatar是由清华大学联合IDEA团队推出的单目视频重建技术,能够从普通单目视频中生成高质量、可重光照的3D头像。它采用可学习的形变基和线性蒙皮技术,结合精确的表情编码器和物理渲染模型,实现高精度重建和实时渲染(约155 FPS)。支持材质编辑、跨视角渲染和动画化,适用于数字人、虚拟主播、AR/VR、游戏开发和影视制作等领域。

Mobvoi MCP Server

Mobvoi MCP Server是出门问问推出的一站式AI工具,集成语音生成、声音克隆、图片驱动数字人、视频配音等多模态能力。用户可通过简单输入文本调用功能,支持多客户端和多场景应用。基于标准化接口和开源生态,提供高效、灵活的数字生产力解决方案,适用于内容创作、虚拟主播、在线教育等多个领域。

谦寻

谦寻控股是一家以“数字化、平台化、国际化”为核心方向,致力打造直播电商产业生态集群的数字科技公司,总部位于浙江杭州。

Vmotionize

一个领先的AI动画生成平台,能够将视频、音乐、文本和图像轻松转换为令人惊叹的3D动画。Vmotionize可以从任何媒体中有效捕捉角色动作,并将其转化逼真的运动动画。

讯飞配音

提供文字转语音、语音合成、国内专业的一站式配音服务平台

睿声Reecho

一款专注于5秒瞬时语音克隆和超拟真语音合成的AI语音克隆平台。

全响AI

一个支持专有知识库投喂和训练的系统,i-Avatar数字人平台能够根据用户的不同需求定制企业或个人的数字人员工。

讯飞数字人

科大讯飞推出的一款基于AI技术的一站式数字人音视频内容生产工具,具有在虚拟“AI演播室”中输入文本或录音,一键完成音、视频作品的输出,3分钟内渲染出稿。包括形象克隆、声音复刻、3D定制、内容生产、虚拟直播、能力接入等功能。