FunASR是由阿里巴巴达摩院开发的开源语音识别工具包,集成了语音识别(ASR)、语音活动检测(VAD)、标点恢复、语言建模、说话人验证、说话人分离以及多说话人ASR等多种功能。该工具包支持工业级语音识别模型的训练与微调,为研究者和开发者提供了高效的解决方案,推动了语音识别技术的进步。通过提供预训练模型和易用接口,FunASR帮助用户快速部署语音识别服务,适应多样化的应用场景。2024年10月,FunASR新增支持Whisper-large-v3-turbo模型,进一步增强了其在语音识别领域的应用能力。
发表评论 取消回复