OmniAudio-2.6B是由Nexa AI开发的一款面向边缘设备的音频语言模型,专为高效音频文本处理设计。该模型基于2.6亿参数的多模态架构,结合了Gemma-2-2b、Whisper Turbo以及自定义投影模块,实现了自动语音识别与语言模型的无缝集成,显著降低了延迟和资源消耗。在性能测试中,OmniAudio-2.6B在2024款Mac Mini M4 Pro上的解码速度较Qwen2-Audio-7B-Instruct提升了5.5至10.3倍。凭借其卓越的性能,OmniAudio-2.6B适用于语音问答、对话生成、创意内容创作等多种应用场景,并可通过Nexa SDK在本地设备上运行,为用户提供强大的边缘AI解决方案。

评论列表 共有 0 条评论

暂无评论

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部