Amphion

简介：Amphion是一款开源音频生成工具包，包含文本转语音（TTS）、歌声合成（SVS）、语音转换（VC）、歌声转换（SVC）、文本转音频（TTA）和文本转音乐（TTM）等功能。它支持多种神经声码器，并提供可视化模型架构，帮助用户快速掌握音频生成技术。通过统一框架和预训练模型，Amphion推动了音频生成领域的研究和应用发展。

AI小编 803 阅读 0 评论 63 点赞

项目地址

Amphion是一款开源的音频、音乐和语音生成工具包，由香港中文大学（深圳）武执政教授团队联合上海人工智能实验室和深圳市大数据研究院共同研发。该工具包旨在支持可重复的研究，助力初学者快速进入音频、音乐和语音生成领域。Amphion提供了丰富的功能模块，包括文本转语音（TTS）、歌声合成（SVS）、语音转换（VC）、歌声转换（SVC）、文本转音频（TTA）以及文本转音乐（TTM）。此外，它集成了多种神经声码器（如MelGAN、HiFi-GAN）和全面的评估指标，确保生成音频的质量和一致性。Amphion的独特之处在于其可视化功能，能够展示经典模型和架构的内部工作机制，便于研究人员和工程师深入理解。

本文分类：AI项目与工具
本文标签：音频生成文本转语音歌声合成语音转换神经声码器模型可视化音乐创作虚拟主播智能语音助手预训练模型
浏览次数：803 次浏览
发布日期：2025-06-12 00:00:00
本文链接：https://sihangdaima.com/AIxiangmuyugongju/10614.html

评论列表共有 0 条评论

暂无评论

Amphion

评论列表 共有 0 条评论

发表评论 取消回复

评论列表共有 0 条评论

发表评论取消回复