语音

通义浏览器插件

通义浏览器插件是一款集实时语音识别、AI字幕翻译、智能总结于一体的多功能AI工具。支持在线课程、会议记录、外语视频观看等多种应用场景,提供语音转文字、翻译、内容总结等功能,帮助用户高效管理在线信息。此外,用户可通过插件快速访问网页版平台,查看和整理记录内容,实现更便捷的信息处理体验。

刺鸟配音

一款专业文字转语音的有情绪的配音软件,刺鸟配音声音媲美真人的AI配音技术,可以为你轻松配出好声音。

麦句

不仅为用户提供了一种新颖的娱乐方式,也为需要情感支持和交流的人提供了一个平台。

Fugatto

Fugatto是一款由英伟达开发的音频合成与转换模型,利用增强型Transformer架构实现了从文本到音频的高效转化。它支持多种音频生成任务,如音乐创作、声音效果设计及语音合成,并可通过ComposableART技术实现对声音属性的精细调控。此外,Fugatto擅长生成动态变化的声音景观,广泛应用于音乐创作、声音设计及广告音频制作等领域。

OuteTTS

OuteTTS是一款基于开源技术的文本到语音(TTS)工具,利用纯语言建模方法生成自然语音。它支持语音克隆和自定义说话人声音,具备音频标记化、CTC强制对齐和结构化提示创建等功能。OuteTTS与llama.cpp和GGUF格式兼容,适用于有声读物、智能客服、语音导航等多种应用场景。

场辞

场辞,AI视频字幕制作软件,一款基于语音识别技术的视频字幕制作软件,一键智能识别字幕,提供语音转字幕、一键加字幕、视频加字幕,字幕快捷校对等功能,用AI加速你的创作。

讯飞配音

提供文字转语音、语音合成、国内专业的一站式配音服务平台

Slides Orator

Slides Orator是一款基于AI技术的演示工具,支持用户通过创建虚拟形象实现幻灯片的实时解说。其核心功能包括语音旁白生成、实时聊天互动及模拟演示场景,广泛应用于企业培训、产品推介、在线教育和会议演讲等领域,旨在提升信息传递效率和观众参与度。通过简化操作流程,该工具帮助用户高效完成高质量演示内容的准备。

Audio2Face

一款由AI驱动的应用程序,通过语音生成富有表现力的3D面部动画。

Speech

Speech-02 是 MiniMax 推出的先进文本到语音模型,支持零样本语音克隆和高质量语音合成,具备多语言支持和情感控制功能。采用自回归 Transformer 和 Flow-VAE 架构提升语音自然度和相似度,适用于配音、有声读物、智能助手等多种场景。提供 HD 和 Turbo 两个版本,满足不同性能需求。