数学推理 - 智狐AI导航

OpenMath

OpenMath-Nemotron是由英伟达推出的一系列开源数学推理模型，专为解决复杂数学问题设计，涵盖从基础到奥林匹克级别的题目。其基于大规模数据集OpenMathReasoning训练，具备长推理、多模式推理和工具集成推理能力。模型支持多种应用场景，包括数学教育、竞赛训练、学术研究和工业应用。项目提供GitHub、HuggingFace和arXiv等资源，适用于需要高精度数学推理的AI系统开发

AI项目与工具 2025年06月11日 56 点赞 0 评论 446 浏览

AReaL

AReaL-boba 是由蚂蚁技术研究院与清华大学联合推出的开源强化学习训练框架，具备高效训练、推理能力提升、低资源训练等核心功能。其 7B 模型在数学推理任务中表现突出，且支持大规模模型的低成本复现。框架集成 SGLang 推理系统，采用数据蒸馏与工程优化技术，提升训练效率。适用于教育、自然语言处理、智能体开发等领域，具有高度可复现性和开源特性。

AI项目与工具 2025年06月12日 46 点赞 0 评论 447 浏览

Dream

Dream-7B是由香港大学与华为诺亚方舟实验室联合开发的开源扩散模型，支持文本、数学和代码生成，具备双向上下文建模能力和灵活的生成控制。其在通用任务、数学推理和编程方面表现优异，适用于文本创作、数学求解、编程辅助及复杂任务规划等多种场景，提供高效且高质量的生成服务。

AI项目与工具 2025年06月12日 26 点赞 0 评论 481 浏览

Math24o

Math24o 是 SuperCLUE 开源的高中奥林匹克数学竞赛级别数学推理测评基准，基于 2024 年全国高中数学竞赛预赛试题，包含 21 道高难度解答题。评测通过程序自动判断答案一致性，客观评估模型正确率。支持自动化评估流程，适用于教育、学术研究和模型优化等领域，为数学推理能力的提升提供重要工具。

AI项目与工具 2025年06月12日 22 点赞 0 评论 484 浏览

InfiMM

InfiMM-WebMath-40B是由字节跳动与中国科学院联合推出的大规模多模态数据集，涵盖大量数学和科学内容，包括文本、公式、符号及图像。该数据集通过筛选、清洗和标注优化，可显著提升多模态模型的数学推理能力。它适用于数学题库生成、学习工具开发、论文理解及科学研究等多个应用场景。 ---

AI项目与工具 2025年06月12日 100 点赞 0 评论 497 浏览

Kimi

Kimi-VL是月之暗面推出的轻量级多模态视觉语言模型，支持图像、视频、文档等多种输入形式。其基于轻量级MoE架构和原生分辨率视觉编码器，具备强大的图像感知、数学推理和OCR能力。在长上下文（128K）和复杂任务中表现优异，尤其在多模态推理和长视频理解方面超越同类模型。适用于智能客服、教育、医疗、内容创作等多个领域。

AI项目与工具 2025年06月11日 30 点赞 0 评论 508 浏览

BFS

BFS-Prover 是一种基于大语言模型的自动定理证明系统，通过改进广度优先搜索算法和长度归一化评分机制，提高证明搜索效率。系统结合专家迭代、直接偏好优化和分布式架构，支持复杂定理的高效验证，并与 Lean4 深度集成，确保形式化数学问题的逻辑正确性。适用于数学竞赛题、本科及研究生数学研究等领域，推动了自动定理证明技术的发展。

AI项目与工具 2025年06月12日 75 点赞 0 评论 536 浏览

k0

k0-math是一款基于强化学习和思维链推理技术的新一代数学推理模型，由月之暗面推出。它在多个数学基准测试中表现出色，特别是在中考、高考、考研及竞赛级数学题库中的成绩超越了OpenAI的o1-mini和o1-preview模型。k0-math具备深入思考、规划解题思路以及自我反思优化的能力，适用于教育辅导、在线教育平台、竞赛培训、学术研究及自动化测试与评分等多个场景。

AI项目与工具 2025年06月12日 45 点赞 0 评论 576 浏览

OLMo 2 32B

OLMo 2 32B 是由 Allen Institute for AI 推出的开源语言模型，拥有 320 亿参数，性能接近更大规模模型。它采用三阶段训练策略，结合预训练、中期训练和后训练，提升模型稳定性与任务适应性。模型支持多任务处理，涵盖自然语言处理、数学推理、编程辅助和内容创作等领域，并具备高效训练能力与低能耗优势。所有数据、代码和权重均开源，便于研究与开发。

AI项目与工具 2025年06月12日 87 点赞 0 评论 592 浏览

Infinity

Infinity-MM是智源研究院发布的千万级多模态指令数据集，包含4300万条样本，涵盖视觉问答、文字识别、文档分析及数学推理等多领域任务。它通过严格的筛选和去重保证数据质量，并采用合成数据生成技术扩展数据集规模。基于此数据集，智源研究院训练出了20亿参数的Aquila-VL-2B模型，在多项基准测试中表现出色，推动了多模态AI领域的研究与发展。

AI项目与工具 2025年06月12日 87 点赞 0 评论 610 浏览

数学推理

首页

数学推理

列表

默认

浏览次数

发布日期