MMSearch

简介：MMSearch 是一款用于评估大型多模态模型（LMMs）搜索能力的基准测试工具，包含 MMSearch-Engine 框架和 MMSearch 测试集。其核心功能包括问题重构、网页排序和答案总结，通过多模态搜索能力评估提升 LMMs 的性能。实验结果显示 GPT-4o 在该测试中表现优异，且增加计算量比扩大模型规模更具优势。

AI小编 608 阅读 0 评论 44 点赞

项目地址

MMSearch 是一款专为评估大型多模态模型（LMMs）作为 AI 搜索引擎能力而设计的基准测试工具。它由 MMSearch-Engine 框架和包含 300 个问题的 MMSearch 测试集组成，问题覆盖 14 个子领域，分为新闻和知识两大类别，确保测试内容与 LMMs 的训练数据无重叠，从而实现公平评估。MMSearch-Engine 框架通过问题重构、网页排序和答案总结三个阶段增强 LMMs 的搜索能力。实验表明，GPT-4o 在该基准测试中表现优于商业产品 Perplexity Pro，且增加测试时的计算量相较于扩大模型规模更为有效。

本文分类：AI项目与工具
本文标签：多模态模型搜索引擎评估问题重构网页排序答案总结学术研究搜索引擎优化智能助手内容推荐教育工具
浏览次数：608 次浏览
发布日期：2025-06-12 00:00:00
本文链接：https://sihangdaima.com/AIxiangmuyugongju/11109.html

评论列表共有 0 条评论

暂无评论

MMSearch

评论列表 共有 0 条评论

发表评论 取消回复

评论列表共有 0 条评论

发表评论取消回复