推理能力

书生·浦语

书生·浦语是上海人工智能实验室开发的一款开源AI大模型,具备卓越的推理能力和超长文本处理功能。该模型能够处理高达一百万词元的文本输入,支持联网搜索并整合信息,显著提升了处理复杂问题的能力。书生·浦语秉持开源理念,免费提供商用授权,旨在通过高质量开源资源赋能创新,推动AI技术的发展和应用。它支持多种功能,包括超长文本处理、增强推理能力、自主信息搜索与整合等,并提供了多样化的参数版本,以满足不同的应用

OpenAI o1模型

OpenAI的最新推理系列AI大模型“Strawberry”,包括“o1-preview”和成本较低的“o1 mini”版本。该模型通过强化学习训练,具备复杂的推理能力和多模态理解能力。它采用了“思维链”机制,增强推理透明度,具备自我纠错功能。在国际数学奥林匹克等基准测试中表现出色,展现出强大的性能。设计时考虑了安全性、可靠性和成本效率。 ---

OpenR

OpenR是一个由多家知名高校联合开发的开源框架,专注于通过强化学习和搜索技术提升大型语言模型的推理能力。它集成了数据获取、强化学习训练及非自回归解码功能,支持多种搜索算法和在线强化学习训练,能够有效提高模型的推理效率和精度。同时,其自动化数据处理能力减少了人工标注的需求,适用于数学问题求解、代码生成、自然语言处理等多种应用场景。

夸克灵知大模型

夸克灵知大模型是一款具备高阶推理能力的智能学习工具,专为不同阶段的学习者设计。它提供详尽的题目解析、启发式教学及实时互动功能,涵盖K12教育、高等教育及成人教育等多个领域,助力用户全面提升学习效率和理解力。

POINTS 1.5

POINTS 1.5 是腾讯微信开发的多模态大模型,基于LLaVA架构设计,包含视觉编码器、投影器和大型语言模型。它在复杂场景OCR、推理、关键信息提取、数学问题解析及图片翻译等方面表现突出,适用于票据识别、自动客服、新闻摘要、学术论文处理、旅游翻译和在线教育等多个领域。该模型通过高效的数据处理和特征融合技术,实现了跨模态任务的精准处理与高效输出。

AGUVIS

AGUVIS是一款由香港大学与Salesforce联合开发的纯视觉框架,专为自主GUI智能体设计。它支持跨平台操作,通过图像观察与自然语言指令的关联,以及显式规划和推理能力,提高了代理在复杂数字环境中的交互效率。AGUVIS采用大规模数据集及两阶段训练方法,实现了在离线与在线场景中的高效性能,成为首个不依赖外部闭源模型即可独立完成任务的纯视觉GUI代理。

Sky

Sky-T1是由加州大学伯克利分校NovaSky团队开发的开源推理AI模型,具备高性价比和强大推理能力。其训练成本仅450美元,数据来源经过优化处理,可在数学、编程和科学领域表现出色。模型支持用户从零复现,适用于教育、科研及软件开发等场景。在MATH500和LiveCodeBench测试中,Sky-T1表现优于部分早期OpenAI模型,展现出良好的实用价值。

DeepSeek R1

DeepSeek R1-Zero 是一款基于纯强化学习训练的推理模型,无需监督微调即可实现高效推理。在 AIME 2024 竞赛中 Pass@1 分数达到 71.0%,展现强大逻辑与数学推理能力。支持长上下文处理,具备自我进化、多任务泛化等特性,并通过开源和蒸馏技术推动模型应用与优化。

TeleAI

TeleAI-t1-preview是中国电信人工智能研究院开发的复杂推理大模型,具有强大的数学与逻辑推理能力。它在多项国际评测中表现优异,尤其在数学竞赛和古籍解析方面表现突出。模型融合了强化学习与思考范式,支持从文言文到现代汉语的数学题解析,并具备策略推理与单位换算等功能。该模型即将上线天翼AI开放平台,未来将在教育、科研等领域广泛应用。

Satori

Satori是一款由MIT和哈佛大学等机构联合开发的7B参数大语言模型,专注于提升推理能力。其采用COAT机制和两阶段训练框架,结合强化学习优化模型性能,具备自回归搜索、数学推理、跨领域任务处理以及自我纠错等核心能力。Satori在数学和逻辑推理任务中表现突出,广泛应用于科研、教育、智能客服等多个领域,代码、数据和模型均已开源。