Megrez-3B-Omni是由无问芯穹开发的全球首款端侧全模态理解开源模型,能够高效处理图像、音频及文本三种数据模态。该模型在多项主流测试集中表现优异,其推理速度比同类同精度模型快3倍。Megrez-3B-Omni兼容中英双语语音输入,并支持复杂多轮对话处理,可实现图片或文字的语音提问,为用户提供直观自然的交互体验。
Megrez-3B-Omni是由无问芯穹开发的全球首款端侧全模态理解开源模型,能够高效处理图像、音频及文本三种数据模态。该模型在多项主流测试集中表现优异,其推理速度比同类同精度模型快3倍。Megrez-3B-Omni兼容中英双语语音输入,并支持复杂多轮对话处理,可实现图片或文字的语音提问,为用户提供直观自然的交互体验。
发表评论 取消回复