智能代理
Agentic Object Detection
Agentic Object Detection是由吴恩达团队研发的新型目标检测技术,通过智能代理系统实现无需标注数据的目标识别。用户输入文字提示后,AI可精准定位图像中的目标及其属性,支持内在属性、上下文关系及动态状态的识别。该技术无需复杂训练流程,适用于装配验证、作物检测、医疗影像分析、危险物品识别和商品管理等多种场景,显著提升了检测效率和准确性。
AndroidGen
AndroidGen 是一个基于大语言模型(LLM)的智能代理框架,专注于提升 Agent 在数据稀缺环境下的任务执行能力。它通过无监督方式收集用户操作轨迹并进行训练,结合 ExpSearch、ReflectPlan、AutoCheck 和 StepCritic 四个核心模块,增强任务规划、执行和评估能力。该框架在 AndroidWorld 和 AitW 基准测试中表现出色,适用于自动化任务处理、
AgenticSeek
AgenticSeek是一款完全本地化的开源AI助手,作为Manus的开源替代品,它能够在本地设备上自主执行任务,如浏览网页、编写代码和规划项目,确保用户隐私。支持多种编程语言,具备智能任务拆解与执行能力,用户可通过语音或文本交互。适用于注重隐私和希望在本地环境中使用AI工具的用户。
Browser Operator
Browser Operator 是 Opera 浏览器推出的 AI 工具,通过自然语言指令实现网页浏览任务的自动化操作,如购物、预订、信息收集等。支持用户随时监控和干预任务,所有操作在本地完成,确保数据隐私。适用于多种日常场景,提升浏览效率和用户体验。
BrowseComp
BrowseComp 是 OpenAI 开源的 AI 浏览能力评估基准,包含 1266 个高难度问题,覆盖多个领域。它要求 AI 代理进行多步骤推理和跨网站信息整合,测试其搜索、分析和适应能力。Deep Research 模型在其中表现优异,准确率达 51.5%。该工具适用于企业知识库、电商导购、政府服务及 AI 研究等领域,推动智能浏览技术发展。