推理评估

首页

推理评估

列表

默认

浏览次数

发布日期

MME

MME-CoT 是一个用于评估大型多模态模型链式思维推理能力的基准测试框架，涵盖数学、科学、OCR、逻辑、时空和一般场景六大领域，包含1,130个问题，每题均附关键推理步骤和图像描述。该框架引入推理质量、鲁棒性和效率三大评估指标，全面衡量模型推理能力，并揭示当前模型在反思机制和感知任务上的不足，为模型优化和研究提供重要参考。

AI项目与工具 2025年06月12日 36 点赞 0 评论 983 浏览

推理评估 首页 推理评估

列表 默认 浏览次数 发布日期

MME

推理评估

首页

推理评估

列表

默认

浏览次数

发布日期