TTS - 智狐AI导航

Llasa TTS

Llasa TTS是基于LLaMA架构的开源文本转语音模型，支持高质量语音合成、情感表达和音色克隆。采用单层VQ编解码器和Transformer结构，具备多语言支持及长文本处理能力，适用于智能助手、有声读物、游戏娱乐等场景。模型提供不同参数规模版本，支持零样本学习，提升语音自然度和表现力。

AI项目与工具 2025年06月12日 71 点赞 0 评论 636 浏览

Fish Speech 1.5

Fish Speech 1.5是一款基于深度学习的文本转语音（TTS）工具，支持多语言文本输入，通过Transformer、VITS、VQVAE和GPT等技术实现高质量语音合成。它具备零样本和少样本语音合成能力，延迟时间短，无需依赖音素，泛化性强，且支持本地化部署。Fish Speech 1.5可应用于有声读物、辅助技术、语言学习及客户服务等多个领域。

AI项目与工具 2025年06月12日 14 点赞 0 评论 631 浏览

摩笔天书

摩笔天书是一款由摩尔线程研发的AI辅助绘本创作工具，它结合了故事生成、图像生成、语音合成及音乐创作等多种AI技术，为用户提供从文字到完整绘本的全流程自动化创作服务。用户可轻松调整生成内容，满足个性化需求。该工具以其卓越的图文一致性、易读性及自动生成的音乐和旁白，成为无设计经验者快速产出高质量绘本的理想选择。

AI项目与工具 2025年06月12日 26 点赞 0 评论 618 浏览

百度曦灵数字人平台

基于百度领先的数字人和人工智能技术，面向视频、直播、交互等全场景应用，让数字人赋能千行百业实现内容和服务的智能化升级。

Ai视频生成 2025年06月05日 97 点赞 0 评论 618 浏览

Vocloner是一款基于人工智能的在线语音克隆工具，用户可通过上传目标语音音频并输入文本，快速生成克隆声音，无需训练语音网络。支持多语言及多种中文方言，提供经典版本和更新版本两种克隆选项，经典版使用Coqui TTS技术，更新版采用Coqui AI的XTTS工具，增强克隆效果。功能包括即时语音克隆、模型创建与保存、多语言支持、不同说话风格和角色模仿，适用于内容创作、无障碍支持、语言学习和个性化数

AI项目与工具 2025年06月11日 47 点赞 0 评论 614 浏览

易魔声EmotiVoice

易魔声EmotiVoice是一个强大的开源TTS引擎，支持中英文双语，包含2000多种不同的音色，以及特色的情感合成功能，支持合成包含快乐、兴奋、悲伤、愤怒等广泛情感的语音。

Ai开源项目 2025年06月05日 27 点赞 0 评论 612 浏览

Noiz AI

Noiz AI 是一款基于自研大模型的 AI 语音合成与克隆工具，支持 3-10 秒音频快速生成逼真语音模型，适用于 TTS、视频配音和多语言翻译。具备情感化语音输出与一键语言转换功能，广泛应用于内容创作、教育、商业及娱乐等领域，提升内容表达效果与国际化传播能力。

AI项目与工具 2025年06月12日 47 点赞 0 评论 598 浏览

OpenAudio S1

OpenAudio S1是Fish Audio推出的文本转语音（TTS）模型，基于200万小时音频数据训练，支持13种语言。采用双自回归架构和RLHF技术，生成自然流畅的语音，支持50多种情感和语调标记。具备零样本和少样本语音克隆功能，仅需10到30秒音频即可生成高保真声音。适用于视频配音、播客、游戏角色语音、虚拟助手、游戏娱乐、教育培训及客服系统等场景。提供40亿参数完整版和5亿参数开源版，满足

AI项目与工具 2025年06月11日 28 点赞 0 评论 592 浏览

Speechki

Speechki 是一款高效文本转语音工具，支持多语言和多种语音选择，具备实时校对、角色管理和精准音频控制功能。用户可通过可视化编辑器灵活调整语速、语调和音高，适用于内容创作、教育、企业营销等多种场景。同时支持与 ChatGPT 集成，提升文本转音频的效率和实用性。

AI项目与工具 2025年06月12日 50 点赞 0 评论 588 浏览

海豚配音

一款集逼真效果、丰富音色和细腻情感于一体的全能AI配音平台。拥有超过500种栩栩如生的真人音色和1000多种独具特色的二次元音色。

字幕配音 2025年06月05日 35 点赞 0 评论 573 浏览

TTS

首页

TTS

列表

默认

浏览次数

发布日期