BrowseComp

首页

BrowseComp

列表

默认

浏览次数

发布日期

BrowseComp

BrowseComp 是 OpenAI 开源的 AI 浏览能力评估基准，包含 1266 个高难度问题，覆盖多个领域。它要求 AI 代理进行多步骤推理和跨网站信息整合，测试其搜索、分析和适应能力。Deep Research 模型在其中表现优异，准确率达 51.5%。该工具适用于企业知识库、电商导购、政府服务及 AI 研究等领域，推动智能浏览技术发展。

AI项目与工具 2025年06月11日 50 点赞 0 评论 769 浏览

BrowseComp 首页 BrowseComp

列表 默认 浏览次数 发布日期

BrowseComp

BrowseComp

首页

BrowseComp

列表

默认

浏览次数

发布日期