音频
RealtimeSTT
RealtimeSTT是一款开源的实时语音转文本库,具备高精度语音活动检测、GPU加速的实时转录能力以及语音唤醒功能。支持多语言识别,适用于语音助手、会议记录、实时字幕等场景,提供灵活的音频输入与预处理机制,便于开发者快速集成和扩展。
MacWhisper
MacWhisper是一款基于OpenAI Whisper技术的AI音频转文字工具。它能够在本地设备上将音频文件快速转录成文本,并支持多种语言。该工具具有多种音频和视频格式兼容性,提供不同的转录模型选择,支持字幕导出,且具备视频播放功能。最新版本增加了基于Apple芯片的硬件加速,提升了实时语音识别效率,并集成了OpenAI语言模型以提高转录和翻译的准确性。MacWhisper适用于记者、媒体工作
MusicFX DJ
MusicFX DJ是一款由Google DeepMind开发的人工智能音乐生成工具,利用实时文本提示生成多样化音乐作品。它支持多提示词混合、风格精细调控、乐器编排以及高质量音频输出等功能,适用于个人创作、现场表演、音乐教育及社交媒体内容制作等多个场景,为音乐爱好者和专业人士提供便捷高效的创意工具。
