问题解决

AgentGPT

是由reworkd.ai 开发的开源项目,允许用户创建自主AI智能体(AI代理)以在互联网上执行各种任务。它基于 OpenAI 开发的 GPT-3.5 和 GPT-4 模型构建,使其能够自主行动,无需人工干预。

Factory AI

由红杉资本投资的AI编程工具,目的是给企业级软件开发提供智能、高效的解决办法。它能理解软件需求、规划项目、编写代码、审查质量以及编制文档,全面优化软件开发流程。

AutoGen

微软开发的一个开源框架,用于构建和管理基于LLM的多代理系统。它允许用户创建多个Agent,这些代理可以通过对话协作完成复杂的任务。

AlphaEvolve

AlphaEvolve是谷歌DeepMind开发的通用科学代理,结合大型语言模型与进化算法,用于设计和优化复杂算法。它在数据中心调度、硬件设计、AI训练和数学问题解决等领域取得显著成果,如优化矩阵乘法、提升系统效率等。系统采用自动化评估机制,支持跨领域应用,具备高效计算和持续优化能力。

Xiaomi MiMo

Xiaomi MiMo 是小米推出的推理型大模型,具备强大的数学推理与代码生成能力。通过预训练与后训练相结合,利用大量高价值语料及强化学习算法,在 7B 参数规模下实现超越更大模型的表现。支持多场景应用,包括教育、科研、软件开发等,已开源至 HuggingFace,便于开发者使用与研究。

OpenMath

OpenMath-Nemotron是由英伟达推出的一系列开源数学推理模型,专为解决复杂数学问题设计,涵盖从基础到奥林匹克级别的题目。其基于大规模数据集OpenMathReasoning训练,具备长推理、多模式推理和工具集成推理能力。模型支持多种应用场景,包括数学教育、竞赛训练、学术研究和工业应用。项目提供GitHub、HuggingFace和arXiv等资源,适用于需要高精度数学推理的AI系统开发

PlanGEN

PlanGEN 是谷歌研发的多智能体协作框架,用于解决复杂问题的规划与推理。它包含约束、验证和选择三大智能体,支持多智能体协作、约束引导、算法自适应选择等功能。提供四种实现方式,适用于不同复杂度任务,如日程安排、数学证明、自动驾驶等。具有模型不可知性,可与多种大语言模型结合,具备良好的可扩展性和灵活性。

Sky

Sky-T1是由加州大学伯克利分校NovaSky团队开发的开源推理AI模型,具备高性价比和强大推理能力。其训练成本仅450美元,数据来源经过优化处理,可在数学、编程和科学领域表现出色。模型支持用户从零复现,适用于教育、科研及软件开发等场景。在MATH500和LiveCodeBench测试中,Sky-T1表现优于部分早期OpenAI模型,展现出良好的实用价值。

QVQ

QVQ是一个基于Qwen2-VL-72B的开源多模态推理模型,擅长处理文本、图像等多模态数据,具备强大的视觉理解和复杂问题解决能力。它在数学和科学领域的视觉推理任务中表现出色,但在实际应用中仍需解决语言切换、递归推理及图像细节关注等问题。QVQ可广泛应用于教育、自动驾驶、医疗图像分析、安全监控及客户服务等领域。