TTS - 智狐AI导航

Fish Speech 1.5

Fish Speech 1.5是一款基于深度学习的文本转语音（TTS）工具，支持多语言文本输入，通过Transformer、VITS、VQVAE和GPT等技术实现高质量语音合成。它具备零样本和少样本语音合成能力，延迟时间短，无需依赖音素，泛化性强，且支持本地化部署。Fish Speech 1.5可应用于有声读物、辅助技术、语言学习及客户服务等多个领域。

AI项目与工具 2025年06月12日 14 点赞 0 评论 753 浏览

摩笔天书

摩笔天书是一款由摩尔线程研发的AI辅助绘本创作工具，它结合了故事生成、图像生成、语音合成及音乐创作等多种AI技术，为用户提供从文字到完整绘本的全流程自动化创作服务。用户可轻松调整生成内容，满足个性化需求。该工具以其卓越的图文一致性、易读性及自动生成的音乐和旁白，成为无设计经验者快速产出高质量绘本的理想选择。

AI项目与工具 2025年06月12日 26 点赞 0 评论 760 浏览

Llasa TTS

Llasa TTS是基于LLaMA架构的开源文本转语音模型，支持高质量语音合成、情感表达和音色克隆。采用单层VQ编解码器和Transformer结构，具备多语言支持及长文本处理能力，适用于智能助手、有声读物、游戏娱乐等场景。模型提供不同参数规模版本，支持零样本学习，提升语音自然度和表现力。

AI项目与工具 2025年06月12日 71 点赞 0 评论 768 浏览

百度曦灵数字人平台

基于百度领先的数字人和人工智能技术，面向视频、直播、交互等全场景应用，让数字人赋能千行百业实现内容和服务的智能化升级。

Ai视频生成 2025年06月05日 97 点赞 0 评论 770 浏览

易魔声EmotiVoice

易魔声EmotiVoice是一个强大的开源TTS引擎，支持中英文双语，包含2000多种不同的音色，以及特色的情感合成功能，支持合成包含快乐、兴奋、悲伤、愤怒等广泛情感的语音。

Ai开源项目 2025年06月05日 27 点赞 0 评论 771 浏览

kokoroTTS

一款开源、高性能的文本转语音（TTS）模型，Kokoro TTS拥有8200万参数，基于StyleTTS 2架构，提供高质量、自然的语音合成，适用于有声书、播客等。

Ai语音工具 2025年06月05日 80 点赞 0 评论 803 浏览

EasyVideoTrans

EasyVideoTrans是一款开源的AI视频翻译工具，支持从视频中提取音频并翻译字幕，同时提供多样化的声音风格以实现自然的配音效果。它适用于视频创作者、教育机构、企业培训及品牌宣传等领域，能够快速生成高质量的中文版本视频，满足跨语言沟通的需求。

AI项目与工具 2025年06月12日 39 点赞 0 评论 806 浏览

EmotiVoice

EmotiVoice是网易有道推出的开源文本到语音系统，支持中英文及2000+音色，能根据提示生成带情感的语音。具备情感合成、语音克隆、多语言支持等功能，提供Web界面和API接口，适用于有声读物、智能助手、教育、客服等场景，技术上支持高效部署与模型微调。

AI项目与工具 2025年06月12日 30 点赞 0 评论 819 浏览

Orpheus TTS

Orpheus TTS 是一款基于 Llama-3b 架构的开源文本到语音系统，支持自然、富有情感的语音生成。具备零样本语音克隆能力，无需预训练即可模仿特定语音，延迟低至 200 毫秒，适合实时应用。支持多种语音风格和情感控制，适用于有声读物、虚拟助手、游戏、教育等多个领域。

AI项目与工具 2025年06月12日 26 点赞 0 评论 819 浏览

Toucan TTS

Toucan TTS是一款由德国斯图加特大学自然语言处理研究所开发的文本到语音合成工具箱。它基于Python和PyTorch构建，支持超过7000种语言及多种方言和变体。主要功能包括多说话人语音合成、语音风格克隆、人机交互编辑、语音参数调整以及发音清晰度和性别特征调整。该工具箱适用于语音模型教学、文字朗读和多语言应用开发等场景，并提供在线交互式演示功能，方便用户快速理解和使用。

AI项目与工具 2025年06月12日 89 点赞 0 评论 837 浏览

TTS

首页

TTS

列表

默认

浏览次数

发布日期