开源项目

DeepWiki

DeepWiki是一款由Devin团队开发的AI代码阅读助手,基于自然语言处理技术,帮助用户理解GitHub代码库并提供详细的文档级解答。支持深度研究、交互式图表生成、私有仓库文档创建等功能,适用于开源项目学习、代码审查、团队协作及教育培训等场景。目前已索引超3万仓库,处理超40亿行代码,对开源项目免费开放。

QrGPT

QrGPT是一款基于AI技术的二维码生成工具,支持用户通过输入链接或提示词自动生成个性化二维码。其主要功能包括快速生成二维码、个性化设计、开源代码以及一键部署。此外,QrGPT适用于多种场景,如营销推广、活动管理、个人名片及社交媒体链接分享等,助力用户高效实现信息传递。

Proxy Lite

Proxy Lite是一款开源的轻量级视觉语言模型,具有30亿参数,支持自动化网页操作。它通过“观察-思考-工具调用”机制,实现网页交互、数据抓取、表单填写等功能,适用于自动化测试、数据提取和智能任务辅助等场景。该工具资源占用低,可在消费级GPU上高效运行,适合开发者快速部署和使用。

OctoTools

OctoTools是斯坦福大学推出的开源智能体框架,通过标准化工具卡片实现复杂推理任务的高效处理。支持多步骤任务规划、工具集成与优化,具备高准确率和广泛适用性,适用于数学、医学、视觉分析等多个领域。

QwenLong

QwenLong-L1-32B是阿里巴巴集团Qwen-Doc团队开源的首个长文本推理大模型,基于渐进式上下文扩展、课程引导的强化学习和难度感知的回顾性采样策略,显著提升长文本场景下的推理能力。该模型在多个DocQA基准测试中表现优异,平均准确率达70.7%,超越多个现有旗舰模型。其功能包括长文本推理、稳定训练、混合奖励、广泛适用性和高性能表现,适用于法律、金融、科研等多个领域。

Archon

Archon 是一个开源 AI 智能体构建与优化平台,支持多智能体协作、领域知识集成、本地 LLM 集成等功能。它提供自动化代码生成、语义搜索、Streamlit 界面交互及 Docker 部署能力,适用于企业、教育、智能家居等多个场景。技术上融合 Pydantic AI 和 LangGraph,强调框架无关性和高效开发流程。

VideoDrafter

一个高质量视频生成的开放式扩散模型,相比之前的生成视频模型,VideoDrafter最大的特点是能在主体不变的基础上,一次性生成多个场景的视频。

Anus

Anus是一个开源自主智能体项目,支持自然语言指令执行、多代理协作、网络交互、文档处理、代码执行及多模态输入处理。其采用混合架构设计,兼容多种模型和部署方式,提供丰富的工具生态系统,适用于教育、原型开发、任务自动化等多个场景,为开发者和研究人员提供高效、灵活的AI开发平台。

Trace.moe

一个开源动漫场景搜索引擎,根据图像反向搜索动漫场景,帮助用户通过截图追溯原始动漫,完全免费无广告。

OmAgent

OmAgent是由Om AI与浙江大学滨江研究院联合开发的多模态语言代理框架,支持文本、图像、视频等多种输入形式,简化设备端智能代理的开发流程。它具备高效模型集成、灵活算法接口和复杂任务处理能力,适用于视频监控、内容推荐、教育辅助等场景,提升设备智能化水平和用户体验。