文本转语音

MiniMax Audio

MiniMax Audio是一款基于人工智能的语音合成工具,支持多语言、多情感及声音克隆功能,可将文本快速转换为自然流畅的语音。它具备降噪、超长文本合成、实时语音生成等特性,适用于视频配音、播客制作、游戏配音等多种应用场景。

DupDub

DupDub是一款由出门问问开发的AI内容生成平台,集成了AI写作、文本转语音、视频编辑等多项功能,支持70多种语言和500多种真实语音效果。它通过简化创作流程,帮助内容创作者快速生成高质量的视频、文本和音频内容,适用于营销、教育、无障碍辅助等多种应用场景,有效提升工作效率与内容影响力。

Speechki

Speechki 是一款高效文本转语音工具,支持多语言和多种语音选择,具备实时校对、角色管理和精准音频控制功能。用户可通过可视化编辑器灵活调整语速、语调和音高,适用于内容创作、教育、企业营销等多种场景。同时支持与 ChatGPT 集成,提升文本转音频的效率和实用性。

OpenAudio S1

OpenAudio S1是Fish Audio推出的文本转语音(TTS)模型,基于200万小时音频数据训练,支持13种语言。采用双自回归架构和RLHF技术,生成自然流畅的语音,支持50多种情感和语调标记。具备零样本和少样本语音克隆功能,仅需10到30秒音频即可生成高保真声音。适用于视频配音、播客、游戏角色语音、虚拟助手、游戏娱乐、教育培训及客服系统等场景。提供40亿参数完整版和5亿参数开源版,满足

Llasa TTS

Llasa TTS是基于LLaMA架构的开源文本转语音模型,支持高质量语音合成、情感表达和音色克隆。采用单层VQ编解码器和Transformer结构,具备多语言支持及长文本处理能力,适用于智能助手、有声读物、游戏娱乐等场景。模型提供不同参数规模版本,支持零样本学习,提升语音自然度和表现力。

Play.HT

PlayHT是一款使用先进技术将文本转换为逼真、人类声音的AI语音生成器平台。PlayHT提供600多种在142种语言和口音中可用的AI语音,为创建引人入胜和专业声音内容提供了广泛的功能和用途。

Asyncflow v1.0

Asyncflow v1.0 是一款基于 AI 的文本转语音工具,支持超过 450 种语音选项,涵盖多种语言和风格。通过 Magic Dust AI 技术,实现快速语音克隆与高质量输出,降低训练成本。提供 API 接口,便于开发集成,适用于播客、广告、教育等多种场景,具备高效、易用和高性价比的特点。

Typecast AI

一款具有情感文本转语音功能的AI语音生成器,可以使用超过400个逼真的声音,将文本转换为逼真的语音。

Speechelo

Speechelo是一款基于先进AI技术的文本转语音工具,支持超过30种性别和语言的声音选择,用户可通过调整语调、速度和音高来自定义语音效果。它兼容主流视频编辑软件,适用于产品演示、教育培训、营销推广等多种场景,助力高效生成高质量语音内容。

PodLM

PodLM是一款利用先进AI技术打造的播客生成工具,能够将网页内容、文本或文档快速转化为高质量的播客节目。其主要功能包括自动脚本生成、一键式网页转播客、文本转播客以及多样化的AI语音定制选项。PodLM还支持多角色语音合成及背景音乐集成,适用于个人创作者、教育机构、新闻媒体和企业等多个领域,显著提升了内容传播效率。