LLM

Magnitude

Magnitude 是一个开源的视觉 AI 代理驱动的端到端测试框架,支持自然语言编写测试用例,结合推理代理与视觉代理实现智能化测试流程。它具备本地运行、CI/CD 集成和托管服务等多种部署方式,适用于 Web 应用测试、自动化测试、生产环境监控等场景,提高测试效率与准确性。

SurveyGO卷姬

SurveyGO是一款由清华大学与面壁智能团队联合开发的开源AI论文写作工具,支持根据用户输入的主题快速生成结构清晰、内容详实的综述文章。其核心技术LLMxMapReduce-V2利用文本卷积算法整合多篇文献,提升信息完整性与逻辑性。支持中英文双语输出,适用于科研、教学、行业分析等多种场景,显著提升文献综述的写作效率与质量。

RAGEN

RAGEN是一款开源的强化学习框架,专为在交互式和随机环境中训练大型语言模型(LLM)推理代理而设计。它基于StarPO架构,支持多轮轨迹优化和多种强化学习算法,如PPO和GRPO。通过MDP形式化和渐进式奖励归一化策略,RAGEN提高了训练的稳定性和效率。其模块化设计支持多种环境,适用于智能对话、游戏AI、自动化推理等多个领域。

Paper2Code

Paper2Code是一款由韩国科学技术院与DeepAuto.ai合作开发的AI工具,基于多Agent大语言模型,能将机器学习论文自动转化为可运行的代码仓库。它通过规划、分析和代码生成三个阶段,确保代码结构清晰且忠实于原论文内容。该工具显著提升了科研复现效率,适用于研究、教学、工业等多个领域,具有高度实用性和准确性。

Spatial

Spatial-RAG是一种用于增强大型语言模型空间推理能力的框架,融合了稀疏空间检索与密集语义检索技术。它通过多目标优化策略平衡空间约束与语义相关性,生成准确、连贯的自然语言回答。该工具可应用于旅游推荐、智能导航、城市规划、地理问答和物流配送等多个领域,提升了空间数据处理的智能化水平。

ACI.dev

ACI.dev 是一个开源 AI 基础设施平台,支持 600 多种预构建工具集成,涵盖主流应用如 Gmail、Slack 和 Notion。提供灵活的函数调用和 MCP 服务器访问方式,具备多租户认证、动态工具发现及自然语言权限管理功能。平台兼容多种 LLM 框架,支持多语言开发,具备监控与日志功能,适用于智能体开发与部署。

VoltAgent

VoltAgent 是一个开源的 TypeScript 框架,用于构建和编排 AI Agent。它提供基础架构和工具,简化与大语言模型的交互、状态管理、外部工具连接及工作流编排。支持多 Agent 系统、记忆管理、RAG 技术、语音交互等功能,并具备可视化监控和灵活的 LLM 支持,适用于智能客服、数据处理、语音控制等多种场景。

Paper2Coder

Paper2Code是一款由韩国科学技术院与DeepAuto.ai联合开发的AI工具,基于多Agent大语言模型,能够将机器学习论文自动转换为可运行的代码仓库。其核心流程包括规划、分析和代码生成三个阶段,确保生成的代码结构清晰、逻辑严谨,并忠实于原始论文。该工具显著提升了研究复现效率,适用于学术研究、教学、工业应用等多个场景,是推动AI研究落地的重要工具。

NoteLLM

NoteLLM 是一款基于多模态大型语言模型的笔记推荐框架,支持文本与图像信息的融合处理。通过自动生成标签、压缩嵌入、对比学习和指令微调等技术,提升推荐准确性与相关性。其升级版 NoteLLM-2 引入多模态上下文学习与晚期融合机制,增强视觉信息处理能力,适用于个性化推荐、冷启动优化及内容创作辅助等场景。

oli

oli 是一款开源的智能代码助手,结合 Rust 后端与 React/Ink 前端,提供高效的代码辅助、文件操作、命令执行等功能。支持多模型集成,包括云 API 和本地 LLM,适用于代码理解、优化、开发调试及项目管理等场景,提升开发效率和用户体验。