AI语音

OpenAudio S1

OpenAudio S1是Fish Audio推出的文本转语音(TTS)模型,基于200万小时音频数据训练,支持13种语言。采用双自回归架构和RLHF技术,生成自然流畅的语音,支持50多种情感和语调标记。具备零样本和少样本语音克隆功能,仅需10到30秒音频即可生成高保真声音。适用于视频配音、播客、游戏角色语音、虚拟助手、游戏娱乐、教育培训及客服系统等场景。提供40亿参数完整版和5亿参数开源版,满足

Eleven v3

Eleven v3是ElevenLabs推出的先进文本转语音模型,支持情感和语调的精确控制,通过内联音频标签实现多样化的表达。它支持多说话人对话,能模拟真实交谈中的语气变化,覆盖超70种语言,适用于媒体影视配音、有声读物制作、游戏开发和教育等领域,提供生动、真实的声音体验。

Vocloner

Vocloner是一款基于人工智能的在线语音克隆工具,用户可通过上传目标语音音频并输入文本,快速生成克隆声音,无需训练语音网络。支持多语言及多种中文方言,提供经典版本和更新版本两种克隆选项,经典版使用Coqui TTS技术,更新版采用Coqui AI的XTTS工具,增强克隆效果。功能包括即时语音克隆、模型创建与保存、多语言支持、不同说话风格和角色模仿,适用于内容创作、无障碍支持、语言学习和个性化数

Arctime

简单、强大、高效的跨平台字幕制作软件

鸭鸭配音

一个在线配音网站,是目前为数不多的免费的在线文字转语音的配音神器,用户只需输入文本,即可生成高度拟人的智能配音。

Chat Video

Chat Video 基于AI的高效视频学习工具,具有语音识别、摘要总结、AI 问答等功能。

PPTalker

一款专门将PPT演示文稿转换成高质量视频的在线工具,通过多语言的AI语音解说和字幕,用户可以在几分钟内将PPT生成高质量的视频。

自得语音

自得语音技术可通过简单的步骤创造出属于你的角色。类似GPT,可生成与真人无异的语音片段,在情感、音色和语速等方面与真人一致。

TTS Online

TTS Online是一款免费的文本转语音工具,提供语音合成服务,支持多种语言,包括英语、法语、德语、西班牙语、阿拉伯语、中文、日语、韩语等,以及多种语音风格。