FunASR

简介：FunASR是一个由阿里巴巴达摩院开源的多功能语音识别工具包，涵盖语音识别（ASR）、语音活动检测（VAD）、标点恢复、说话人验证及分离等功能。它支持工业级模型的训练与微调，并提供预训练模型和易用接口，便于快速部署。新增的Whisper-large-v3-turbo模型进一步提升了其性能，广泛应用于智能助手、会议记录、客服系统和语音搜索等领域。

AI小编 814 阅读 0 评论 99 点赞

项目地址

FunASR是由阿里巴巴达摩院开发的开源语音识别工具包，集成了语音识别（ASR）、语音活动检测（VAD）、标点恢复、语言建模、说话人验证、说话人分离以及多说话人ASR等多种功能。该工具包支持工业级语音识别模型的训练与微调，为研究者和开发者提供了高效的解决方案，推动了语音识别技术的进步。通过提供预训练模型和易用接口，FunASR帮助用户快速部署语音识别服务，适应多样化的应用场景。2024年10月，FunASR新增支持Whisper-large-v3-turbo模型，进一步增强了其在语音识别领域的应用能力。

本文分类：AI项目与工具
本文标签：语音识别 ASR VAD 标点恢复说话人验证多说话人ASR 自然语言处理模型微调开源工具语音活动检测
浏览次数：814 次浏览
发布日期：2025-06-12 00:00:00
本文链接：https://sihangdaima.com/AIxiangmuyugongju/10939.html

评论列表共有 0 条评论

暂无评论

FunASR

评论列表 共有 0 条评论

发表评论 取消回复

评论列表共有 0 条评论

发表评论取消回复