TTS - 智狐AI导航

Speechki

Speechki 是一款高效文本转语音工具，支持多语言和多种语音选择，具备实时校对、角色管理和精准音频控制功能。用户可通过可视化编辑器灵活调整语速、语调和音高，适用于内容创作、教育、企业营销等多种场景。同时支持与 ChatGPT 集成，提升文本转音频的效率和实用性。

AI项目与工具 2025年06月12日 50 点赞 0 评论 589 浏览

Indic Parler

Indic Parler-TTS 是一款由 Hugging Face 与 AI4Bharat 联合开发的多语言文本到语音模型，支持 20 种印度语言和英语，提供 69 种独特语音。该模型基于深度学习架构，通过描述性文本输入实现对音调、语速、情感等参数的灵活控制，适用于多种语音合成场景。在低资源语言上表现优异，具备高自然度和清晰度的语音输出能力。

AI项目与工具 2025年06月12日 55 点赞 0 评论 439 浏览

Llasa TTS

Llasa TTS是基于LLaMA架构的开源文本转语音模型，支持高质量语音合成、情感表达和音色克隆。采用单层VQ编解码器和Transformer结构，具备多语言支持及长文本处理能力，适用于智能助手、有声读物、游戏娱乐等场景。模型提供不同参数规模版本，支持零样本学习，提升语音自然度和表现力。

AI项目与工具 2025年06月12日 71 点赞 0 评论 636 浏览

IndexTTS

IndexTTS 是一款由 B 站开发的高性能文本转语音系统，专注于中文语音合成，支持拼音纠正、精准停顿控制和高自然度语音输出。采用混合建模方法，结合汉字与拼音，提升发音准确性。系统具备零样本语音克隆能力，音质优秀，广泛应用于内容创作、在线教育、智能客服等领域。训练数据丰富，性能指标优异，包括低字词错误率、高扬声器相似性和高主观音质评分。

AI项目与工具 2025年06月12日 15 点赞 0 评论 422 浏览

TicVoice 7.0

TicVoice 7.0 是一款基于 Spark-TTS 的语音合成引擎，采用 BiCodec 技术实现音色与语义的精准控制，支持 3 秒语音克隆、多角色、多情绪表达及中英切换，语音自然流畅，接近广播级水平，适用于智能客服、有声书、影视配音等场景。

AI项目与工具 2025年06月12日 29 点赞 0 评论 503 浏览

Noiz AI

Noiz AI 是一款基于自研大模型的 AI 语音合成与克隆工具，支持 3-10 秒音频快速生成逼真语音模型，适用于 TTS、视频配音和多语言翻译。具备情感化语音输出与一键语言转换功能，广泛应用于内容创作、教育、商业及娱乐等领域，提升内容表达效果与国际化传播能力。

AI项目与工具 2025年06月12日 47 点赞 0 评论 598 浏览

Orpheus TTS

Orpheus TTS 是一款基于 Llama-3b 架构的开源文本到语音系统，支持自然、富有情感的语音生成。具备零样本语音克隆能力，无需预训练即可模仿特定语音，延迟低至 200 毫秒，适合实时应用。支持多种语音风格和情感控制，适用于有声读物、虚拟助手、游戏、教育等多个领域。

AI项目与工具 2025年06月12日 26 点赞 0 评论 683 浏览

EmotiVoice

EmotiVoice是网易有道推出的开源文本到语音系统，支持中英文及2000+音色，能根据提示生成带情感的语音。具备情感合成、语音克隆、多语言支持等功能，提供Web界面和API接口，适用于有声读物、智能助手、教育、客服等场景，技术上支持高效部署与模型微调。

AI项目与工具 2025年06月12日 30 点赞 0 评论 671 浏览

Muyan

Muyan-TTS是一款面向播客场景的开源文本转语音工具，基于超10万小时播客数据训练，支持零样本语音合成与说话人适配，可在0.33秒内生成1秒音频，适合实时与长内容合成。支持本地部署与API调用，应用于播客、有声书、视频配音、AI角色及新闻播报等领域，兼具高效性与灵活性。

AI项目与工具 2025年06月11日 94 点赞 0 评论 455 浏览

Speech

Speech-02 是 MiniMax 推出的先进文本到语音模型，支持零样本语音克隆和高质量语音合成，具备多语言支持和情感控制功能。采用自回归 Transformer 和 Flow-VAE 架构提升语音自然度和相似度，适用于配音、有声读物、智能助手等多种场景。提供 HD 和 Turbo 两个版本，满足不同性能需求。

AI项目与工具 2025年06月11日 33 点赞 0 评论 464 浏览

TTS

首页

TTS

列表

默认

浏览次数

发布日期