Whisper 是 OpenAI 开源的音频转文字的语音识别模型。它在不同音频的大型数据集上进行训练,也是一个多任务模型,可以执行多语言语音识别以及语音翻译和语言识别。

Whisper 有五种模型尺寸,提供速度和准确性的平衡,其中 English-only 模型提供了四种选择。下面是可用模型的名称、大致内存需求和相对速度。


评论列表 共有 0 条评论

暂无评论

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部