RealtimeSTT

简介：RealtimeSTT是一款开源的实时语音转文本库，具备高精度语音活动检测、GPU加速的实时转录能力以及语音唤醒功能。支持多语言识别，适用于语音助手、会议记录、实时字幕等场景，提供灵活的音频输入与预处理机制，便于开发者快速集成和扩展。

AI小编 872 阅读 0 评论 97 点赞

项目地址

RealtimeSTT是一款开源的实时语音转文本库，专为低延迟应用场景设计。其核心功能包括语音活动检测、实时转录、语音唤醒及多语言支持等，适用于语音助手、会议记录、实时字幕等多种场景。系统通过WebRTCVAD和SileroVAD实现精准的语音识别，结合Faster_Whisper模型进行高效转录，并支持Porcupine或OpenWakeWord进行唤醒词检测。此外，该工具提供灵活的音频输入方式和预处理功能，确保转录结果的准确性与稳定性。开发者可通过feed_audio()方法接入音频流，实时获取并处理文本输出，提升应用集成的便捷性。

本文分类：AI项目与工具
本文标签：语音转文本实时转录语音唤醒多语言支持开源工具音频处理 AI语音识别低延迟智能设备实时字幕
浏览次数：872 次浏览
发布日期：2025-06-12 00:00:00
本文链接：https://sihangdaima.com/AIxiangmuyugongju/9409.html

评论列表共有 0 条评论

暂无评论

RealtimeSTT

评论列表 共有 0 条评论

发表评论 取消回复

评论列表共有 0 条评论

发表评论取消回复