音频

AudioX

AudioX 是一种基于多模态输入的音频生成模型,支持文本、视频、图像等多种输入方式,能够生成高质量的音频和音乐。其核心创新在于多模态掩码训练策略,提升了跨模态理解和生成能力。具备零样本生成、自然语言控制及强大的泛化能力,适用于视频配乐、动画音效、音乐创作等多个场景。

酷音

酷音网是一个真人配音与AI配音、视频拍摄与制作、音乐作词与谱曲、视频策划与创意等领域的创作、交易、推广运营于一体的音视频交易服务平台,致力于打造专注音视频领域的商业生态圈。

ReadSpeaker

ReadSpeaker 提供了一系列强大的文本转语音解决方案,可在任何环境中即时部署逼真、定制的语音交互。

AskNow AI

一个创新的AI问答平台,AskNow AI使用户能够与不同领域的各种知名人士和专家进行个性化的音频对话。

Muyan

Muyan-TTS是一款面向播客场景的开源文本转语音工具,基于超10万小时播客数据训练,支持零样本语音合成与说话人适配,可在0.33秒内生成1秒音频,适合实时与长内容合成。支持本地部署与API调用,应用于播客、有声书、视频配音、AI角色及新闻播报等领域,兼具高效性与灵活性。

Peech

Peech 是一个强大的文本转语音工具,能够轻松地将文本转换成超过50种语言的逼真AI生成音频。

音剪

专业音频制作,激发创新灵感,释放创意潜力,让你的音频创作更自由、便捷和精彩

Notta

Notta是由MIND CRUISER LIMITED推出的语音转写软件,主要针对个人使用,并在海外拥有数十万用户。这款软件具有录音实时转写、音/视频导入转写、文本多格式导出、音频标记等功能,...

TTSMaker马克配音

免费的AI配音平台,可以将文本转换成语音,支持50多种语言和300多种语音风格

NovaVSS

影视音轨分离工具,搭载专为电影电视训练的最强影视音轨分离AI模型,可一键从电影电视中提取人声、音乐、特效声。