BrowseComp 是 OpenAI 开源的 AI 浏览能力评估基准,包含 1266 个高难度问题,覆盖多个领域。它要求 AI 代理进行多步骤推理和跨网站信息整合,测试其搜索、分析和适应能力。Deep Research 模型在其中表现优异,准确率达 51.5%。该工具适用于企业知识库、电商导购、政府服务及 AI 研究等领域,推动智能浏览技术发展。
Rowboat 是一款开源低代码 AI IDE,用于构建多智能体助手的多云平台(MCP)工具。它提供可视化界面和 AI 辅助开发功能,支持用户通过自然语言快速生成智能体结构,并进行实时测试。具备灵活的工具集成能力,可连接多种外部服务,同时提供 API 和 SDK 便于应用集成。支持企业级功能如长会话记忆和权限管理,适用于客户服务、任务协调、业务处理及个人助理开发等多种场景。