FunAudioLLM是由阿里巴巴通义实验室开发的开源语音大模型项目,包括SenseVoice和CosyVoice两个子模型。SenseVoice专注于多语言的高精度语音识别和情感辨识,支持超过50种语言,并在中文和粤语上表现尤为突出。CosyVoice则侧重于自然语音生成,能够控制音色和情感,支持中英日粤韩五种语言。该工具适用于多语言翻译、情感语音对话等场景。相关模型和代码已在ModelScope和HuggingFace平台上公开。

评论列表 共有 0 条评论

暂无评论

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部