语音

Spirit LM

Spirit LM 是一种由 Meta AI 开发的多模态语言模型,能够处理文本和语音数据,支持跨模态学习。其基础版(BASE)和表达版(EXPRESSIVE)分别侧重于语义理解和情感表达。Spirit LM 可用于自动语音识别(ASR)、文本到语音(TTS)、语音分类及情感分析等任务,在语音助手、语音转写、有声读物等领域具有广泛应用前景。

Narakeet

Narakeet 是一款基于自然语音合成技术的在线工具,支持将文本、文档和字幕转换为高质量音频并同步至视频。提供 100 多种语言和 800 多种声音,支持自动化视频制作和多平台分发,适用于教育培训、市场营销、企业沟通及个人创作等多种用途。

丸音APP

丸音APP是一款基于AI音乐创作的音乐分享社区,整合了音乐滤镜,伴奏分离,人声美化,语音去噪等有趣的音乐玩法。

AsrTools

AsrTools是一款无需复杂配置的智能语音转文字工具,支持多种音频格式的转换,生成SRT和TXT字幕文件,适用于视频字幕、会议记录、音频转写等多个场景。它具有友好的用户界面、高效的多线程处理能力以及详细的技术文档,旨在为用户提供便捷、准确的语音转文字解决方案。

MUSIC.AI

MUSIC.AI 是一款基于人工智能的音频处理平台,提供音频分离、混音、母带处理、语音转换、歌词转录等功能,支持多语言翻译与本地化。平台已处理超 10 亿分钟音频,服务数千万用户,适用于音乐制作、视频剪辑及现场演出等多种场景,显著提升音频处理效率与质量。

Outspeed

Outspeed 是一个专注于实时语音和视频 AI 应用开发的平台,提供强大的流媒体处理、低延迟推理、即时部署等功能,支持企业级合规标准。其核心特性包括灵活的模型定制、全面的 SDK 支持以及高效的应用监控工具,广泛应用于客户服务、教育、医疗保健、娱乐、安全监控和质量控制等领域。

Translate.Video

Video是一款视频翻译工具,用户可以轻松地将视频翻译成多种语言。该工具在一个易于使用的应用程序中提供自动字幕、字幕翻译、配音、AI画外音、录音和文本生成。

Miley AI

Miley AI 是一款基于人工智能的生活助手,主要功能包括智能语音记录、情绪识别、自动记账、日程管理以及与苹果健康数据连接的运动监督。这款工具特别适用于忙碌的职场人士、创意工作者、学生、健身爱好者及理财者,帮助他们更高效地管理日常生活和工作任务。

Checksub

Checksub 是一个利用人工智能技术提供视频和音频本地化服务的平台,它通过 AI 驱动的字幕生成和配音功能,帮助用户将视频内容翻译成不同语言,从而扩大观众范围。

Speechify

Speechify是一款文本转语音的应用程序,通过将文本转换成自然的声音,帮助你理解和记住更多你所阅读的内容。它可以在Chrome、iOS、Android和Mac上使用。