FunAudioLLM是由阿里巴巴通义实验室开发的开源语音大模型项目,包括SenseVoice和CosyVoice两个子模型。SenseVoice专注于多语言的高精度语音识别和情感辨识,支持超过50种语言,并在中文和粤语上表现尤为突出。CosyVoice则侧重于自然语音生成,能够控制音色和情感,支持中英日粤韩五种语言。该工具适用于多语言翻译、情感语音对话等场景。相关模型和代码已在ModelScope和HuggingFace平台上公开。
FunAudioLLM是由阿里巴巴通义实验室开发的开源语音大模型项目,包括SenseVoice和CosyVoice两个子模型。SenseVoice专注于多语言的高精度语音识别和情感辨识,支持超过50种语言,并在中文和粤语上表现尤为突出。CosyVoice则侧重于自然语音生成,能够控制音色和情感,支持中英日粤韩五种语言。该工具适用于多语言翻译、情感语音对话等场景。相关模型和代码已在ModelScope和HuggingFace平台上公开。
发表评论 取消回复