文本转语音

猫头音

猫头音是一款基于深度学习技术的AI配音与翻唱工具，支持将文字转化为高质量语音输出，并提供多样化音色选择及丰富的音频处理功能。用户可通过简单操作实现个性化配音、修音翻唱以及音频编辑，广泛适用于视频创作、广告制作、有声读物开发及音乐翻唱等多个领域。

AI项目与工具 2025年06月12日 52 点赞 0 评论 559 浏览

Zonos

Zonos是一款由Zyphra开发的高保真文本到语音（TTS）模型，支持零样本语音克隆和多语言生成，具备精细的情感与语音参数控制能力。其采用Transformer和SSM混合架构，基于大规模语音数据训练，适用于有声读物、虚拟助手、多媒体创作及无障碍技术等多个领域。模型开源且支持实时语音生成，具有广泛的应用潜力。

AI项目与工具 2025年06月12日 69 点赞 0 评论 554 浏览

声咔AI配音

声咔AI配音是在线配音软件平台，垂直深度音频效率工具，支持30多种个性化调音功能等，限制少对用户友好。

创作工具 2026年06月12日 0 点赞 0 评论 551 浏览

Spark

Spark-TTS是一款基于大型语言模型的高效文本转语音工具，支持中英文双语及跨语言合成。它无需额外生成模型，通过LLM预测编码直接生成音频，实现零样本语音克隆。用户可自定义语音参数，如音色、语速等，适用于语音助手、多语言内容创作、智能客服及虚拟角色配音等多种场景。

AI项目与工具 2025年06月12日 47 点赞 0 评论 542 浏览

Nova A.I.

一款简单却强大的在线视频编辑和日志软件，由计算机视觉视频搜索引擎提供支持。

视频剪辑 2025年06月05日 25 点赞 0 评论 536 浏览

Fugatto

Fugatto是一款由英伟达开发的音频合成与转换模型，利用增强型Transformer架构实现了从文本到音频的高效转化。它支持多种音频生成任务，如音乐创作、声音效果设计及语音合成，并可通过ComposableART技术实现对声音属性的精细调控。此外，Fugatto擅长生成动态变化的声音景观，广泛应用于音乐创作、声音设计及广告音频制作等领域。

AI项目与工具 2025年06月12日 44 点赞 0 评论 532 浏览

MARS5

MARS5-TTS是一款开源的AI声音克隆工具，支持140多种语言的文本转语音功能。它能够生成高度逼真的语音，并处理复杂的韵律场景。该工具拥有12亿参数，基于超过15万小时的训练数据。用户可以通过文本中的标点符号和大小写等标记引导语音的韵律和情感，同时提供快速克隆和深度克隆两种模式。MARS5-TTS可应用于内容创作、语言学习、辅助技术、客户服务和多媒体娱乐等多种场景。

AI项目与工具 2025年06月12日 53 点赞 0 评论 532 浏览