数学推理 - 智狐AI导航

Satori

Satori是一款由MIT和哈佛大学等机构联合开发的7B参数大语言模型，专注于提升推理能力。其采用COAT机制和两阶段训练框架，结合强化学习优化模型性能，具备自回归搜索、数学推理、跨领域任务处理以及自我纠错等核心能力。Satori在数学和逻辑推理任务中表现突出，广泛应用于科研、教育、智能客服等多个领域，代码、数据和模型均已开源。

AI项目与工具 2025年06月12日 79 点赞 0 评论 760 浏览

TPO

TPO（Test-Time Preference Optimization）是一种在推理阶段优化语言模型输出的框架，通过将奖励模型反馈转化为文本形式，实现对模型输出的动态调整。该方法无需更新模型参数，即可提升模型在多个基准测试中的性能，尤其在指令遵循、偏好对齐、安全性和数学推理等方面效果显著。TPO具备高效、轻量、可扩展的特点，适用于多种实际应用场景。

AI项目与工具 2025年06月12日 83 点赞 0 评论 764 浏览

TinyR1

TinyR1-Preview是由北京大学与360公司联合研发的32B参数推理模型，采用“分治-融合”策略，通过智能融合数学、编程、科学领域的子模型，实现高性能表现。其在数学领域（如AIME）表现优异，仅用5%参数量即可达到原版R1模型95%以上的性能。模型轻量且高效，适用于教育、科研、开发及企业等多种场景，具备良好的部署灵活性与实用性。

AI项目与工具 2025年06月12日 94 点赞 0 评论 771 浏览

TeleAI

TeleAI-t1-preview是中国电信人工智能研究院开发的复杂推理大模型，具有强大的数学与逻辑推理能力。它在多项国际评测中表现优异，尤其在数学竞赛和古籍解析方面表现突出。模型融合了强化学习与思考范式，支持从文言文到现代汉语的数学题解析，并具备策略推理与单位换算等功能。该模型即将上线天翼AI开放平台，未来将在教育、科研等领域广泛应用。

AI项目与工具 2025年06月12日 88 点赞 0 评论 784 浏览

rStar

rStar-Math是由微软亚洲研究院研发的数学推理工具，采用蒙特卡洛树搜索（MCTS）驱动的深度思考机制，使小型语言模型在数学推理方面达到或超越大型模型水平。通过代码增强的推理轨迹生成、过程偏好模型（PPM）训练和四轮自我进化策略，显著提升了模型的准确率与自我反思能力。该工具已在多个数学基准测试中取得优异成绩，适用于教育、科研、金融、工程和数据分析等多个领域。

AI项目与工具 2025年06月12日 60 点赞 0 评论 797 浏览

OpenAI o4

OpenAI o4-mini 是一款高性能、低成本的小型推理模型，专为快速处理数学、编程和视觉任务优化。它具备多模态能力，可结合图像与文本进行推理，并支持工具调用以提高准确性。在多项基准测试中表现优异，尤其在数学和编程领域接近完整版模型。适用于教育、数据分析、软件开发及内容创作等多个场景，是高效率与性价比兼备的AI工具。

AI项目与工具 2025年06月11日 27 点赞 0 评论 821 浏览

数学推理

首页

数学推理

列表

默认

浏览次数

发布日期

Satori

TPO

TinyR1

TeleAI

rStar

OpenAI o4

数学推理 首页 数学推理

列表 默认 浏览次数 发布日期

Satori

TPO

TinyR1

TeleAI

rStar

OpenAI o4

数学推理

首页

数学推理

列表

默认

浏览次数

发布日期