虚拟主播 - 智狐AI导航

MimicTalk

MimicTalk是一款利用NeRF技术快速生成个性化3D说话人脸模型的工具，其核心功能包括15分钟内完成新身份训练、高质量视频生成、增强的表现力以及上下文学习能力。该工具通过混合适应流程、上下文风格化音频到运动模型等技术，实现了高效的数据样本利用和训练效率提升，适用于虚拟主播、远程协作、VR/AR等领域。

AI项目与工具 2025年06月12日 59 点赞 0 评论 579 浏览

讯飞配音

提供文字转语音、语音合成、国内专业的一站式配音服务平台

字幕配音 2025年06月05日 53 点赞 0 评论 599 浏览

FantasyTalking

FantasyTalking是一种由阿里巴巴AMAP团队与北京邮电大学联合开发的AI工具，能够从静态肖像生成高质量、可动画化的虚拟形象。该工具采用双阶段视听对齐策略，结合面部专注的交叉注意力模块和运动强度调制模块，实现精准口型同步、丰富表情生成及全身动作控制。支持多种风格和姿态，适用于游戏、影视、VR/AR、虚拟主播及教育等领域。

AI项目与工具 2025年06月11日 83 点赞 0 评论 600 浏览

FLOAT

FLOAT是一款基于音频驱动的虚拟人像生成模型，利用运动潜在空间和流匹配技术，实现时间一致性视频生成。它支持情感增强，生成自然且富有表现力的虚拟人物，广泛应用于虚拟主播、视频会议、社交媒体、游戏以及电影制作等多个领域，同时具备高效的采样和生成能力。

AI项目与工具 2025年06月12日 18 点赞 0 评论 602 浏览

MoCha

MoCha 是一款由 Meta 与滑铁卢大学联合开发的端到端对话角色视频生成模型，支持语音与文本驱动的角色动画生成，具备全身动作模拟与多角色对话交互能力。其核心技术包括扩散变压器架构和语音-视频窗口注意力机制，确保动画与语音精准同步。适用于虚拟主播、影视动画、教育内容及数字人客服等多个领域，提升了内容创作效率与表现力。

AI项目与工具 2025年06月12日 34 点赞 0 评论 645 浏览

ACTalker

ACTalker 是一种基于视频扩散模型的端到端工具，可生成高质量、自然的说话人头部视频。支持多信号控制（如音频、表情），采用并行 Mamba 结构和门控机制，实现跨时间和空间的精准面部动作控制。实验表明其在音频同步性和视频质量上表现优异，适用于虚拟主播、远程会议、在线教育等多种场景。

AI项目与工具 2025年06月12日 99 点赞 0 评论 668 浏览

灰豚数字人

灰豚数字人是一款基于AI技术的数字人平台，支持7*24小时自动化直播和个性化视频创作，提供高清4K画质及真人形象克隆功能。用户可自由选择数字人形象并进行多场景应用，如直播带货、企业营销、互动娱乐等。平台提供系统源码和服务器支持，有效降低创作成本，适用于多个行业领域，具备高效、灵活和可扩展的特点。

AI项目与工具 2025年06月12日 99 点赞 0 评论 700 浏览

Amphion

Amphion是一款开源音频生成工具包，包含文本转语音（TTS）、歌声合成（SVS）、语音转换（VC）、歌声转换（SVC）、文本转音频（TTA）和文本转音乐（TTM）等功能。它支持多种神经声码器，并提供可视化模型架构，帮助用户快速掌握音频生成技术。通过统一框架和预训练模型，Amphion推动了音频生成领域的研究和应用发展。

AI项目与工具 2025年06月12日 63 点赞 0 评论 727 浏览

睿声Reecho

一款专注于5秒瞬时语音克隆和超拟真语音合成的AI语音克隆平台。

Ai语音工具 2025年06月05日 83 点赞 0 评论 732 浏览

谦寻

谦寻控股是一家以“数字化、平台化、国际化”为核心方向，致力打造直播电商产业生态集群的数字科技公司，总部位于浙江杭州。

AI服务商 2025年06月05日 85 点赞 0 评论 766 浏览

虚拟主播

首页

虚拟主播

列表

默认

浏览次数

发布日期