QVQ是由阿里云基于Qwen2-VL-72B开发的开源多模态推理模型,旨在提升人工智能的认知能力和复杂问题解决能力。该模型在视觉推理任务中表现出色,特别是在需要深入分析和复杂逻辑判断的领域。QVQ在MMMU评测中获得了70.3的高分,并在多项数学基准测试中超越了Qwen2-VL-72B-Instruct的表现。尽管QVQ具有强大的推理和分析能力,但仍处于实验阶段,存在一些技术局限性,如语言切换问题、递归推理困境以及对图像细节关注的潜在不足。

评论列表 共有 0 条评论

暂无评论

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部