AI项目与工具

WebAgent

WebAgent是阿里巴巴开源的自主搜索AI Agent,具备端到端的自主信息检索与多步推理能力。它能主动搜索多个学术数据库,筛选、分析最相关的文献,整合不同文献中的观点,为用户提供全面且精准的研究报告。WebAgent基于创新的数据合成方法和高效的训练策略,实现高效的多步推理和信息检索能力,适用于学术研究、商业决策和日常生活等多种场景。

KuaiMod

KuaiMod 是快手开发的多模态大模型内容审核系统,能高效识别和过滤有害及低质量视频。它结合视觉语言模型(VLM)和链式推理(CoT)技术,支持动态策略更新和强化学习,提升审核准确性。系统在离线测试中准确率达92.4%,有效降低用户举报率,优化推荐体验,助力平台内容生态健康发展。

响指HaiSnap

HaiSnap是一款零代码AI应用开发平台,支持可视化操作和多模型调用,涵盖文本生成、图像识别等功能。用户可快速搭建并部署应用至云端,同时享受任务管理、小工具和小游戏等辅助功能,适用于教育、企业及个人场景,提升开发效率与用户体验。

Airtop

Airtop是一款AI浏览器自动化工具,基于低成本可扩展的云浏览器,让用户能轻松抓取和控制任何网站。其AI Agent能像人类一样登录浏览网页,支持OAuth、2FA和验证码解决。用户可通过自然语言指令引导浏览器完成任务,无需复杂脚本。Airtop提供实时人工干预功能,适用于数据抓取、自动化测试、内容生成、自动化营销等多种场景,帮助用户高效完成自动化任务。

Open Code Reasoning

Open Code Reasoning(OCR)是英伟达推出的开源代码推理AI模型,基于Nemotron架构设计,支持多种编程语言。它具备代码生成、逻辑补全、多语言处理及高效推理能力,适用于代码优化、教育、测试等多个场景。OCR提供32B、14B和7B三种参数版本,满足不同计算需求,并与主流框架兼容,具有良好的扩展性。

Lemon AI

Lemon AI 是一款创新的全栈通用 AI Agent,支持从任务需求到成果交付的全流程自动化。它具备独立思考和系统规划能力,能灵活调用多种工具,如编写代码、智能浏览网页等。Lemon AI 擅长分解复杂任务,自动分析、优先排序并动态调整计划,实时跟踪进度,提升工作效率与成果质量。

Multiverse

Multiverse是由Enigma Labs开发的全球首个基于AI生成的多人游戏模型,支持实时交互与动态世界生成,确保玩家视角一致。其核心技术包括联合动作向量和双视角通道堆叠,有效解决多人游戏中的同步难题。模型训练成本低,可在普通PC上运行,且项目全面开源,适用于多人游戏开发、VR/AR、AI训练、教育等多个领域。

PixelFlow

PixelFlow是由香港大学与Adobe联合开发的图像生成模型,支持在像素空间中直接生成高质量图像。其基于流匹配技术和多尺度生成策略,实现从低分辨率到高分辨率的逐步生成,有效降低计算成本。该模型在类别条件图像生成和文本到图像生成任务中表现优异,具备强大的语义理解和视觉表达能力。此外,PixelFlow采用端到端训练方式,支持多种ODE求解器,适用于艺术设计、内容创作、教育研究等多个领域。

The AI Scientist

The AI Scientist-v2 是一个端到端的 AI 系统,能够自主完成从提出科学假设到撰写论文的全流程科研任务。它采用基于代理的树搜索方法,提高科学探索效率,并结合视觉-语言模型优化内容质量。该系统已成功生成并通过同行评审的 AI 论文,标志着 AI 在科学研究领域的重大突破。适用于科研自动化、机器学习、跨学科研究及教育等多个场景。

SearchAgent

SearchAgent-X是由南开大学和伊利诺伊大学厄巴纳香槟分校(UIUC)研究人员开发的高效推理框架,旨在提升基于大型语言模型(LLM)的搜索Agent效率。通过高召回率的近似检索、优先级感知调度和无停顿检索等技术,显著提高系统吞吐量(1.3至3.4倍),降低延迟(降至原来的1/1.7至1/5),同时保持生成质量。该框架优化资源利用率,适用于智能客服、搜索引擎、企业知识管理等多种场景,为复杂A