EMOVA(EMotionally Omni-present Voice Assistant)是由香港科技大学、香港大学以及华为诺亚方舟实验室等多家机构合作开发的多模态全能模型。该模型能够同时处理图像、文本和语音三种模态,实现全方位的人机交互体验。基于语义声学分离技术和轻量级情感控制模块,EMOVA具备情感丰富的语音对话能力,显著提升了人机交互的自然度与人性化水平。在视觉语言及语音任务中,EMOVA展现出了卓越的性能,为人工智能领域提供了创新性的解决方案,推动了情感交互技术的发展。

评论列表 共有 0 条评论

暂无评论

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部