OpenR

简介：OpenR是一个由多家知名高校联合开发的开源框架，专注于通过强化学习和搜索技术提升大型语言模型的推理能力。它集成了数据获取、强化学习训练及非自回归解码功能，支持多种搜索算法和在线强化学习训练，能够有效提高模型的推理效率和精度。同时，其自动化数据处理能力减少了人工标注的需求，适用于数学问题求解、代码生成、自然语言处理等多种应用场景。

AI小编 553 阅读 0 评论 40 点赞

项目地址

OpenR是由伦敦大学学院（UCL）、上海交通大学、利物浦大学、香港科技大学（广州）和西湖大学共同研发的开源框架，旨在通过结合搜索、强化学习和过程监督提升大型语言模型（LLM）的推理能力。该框架受到OpenAI的o1模型的启发，采用强化学习显著提高模型推理性能。作为首个提供集成技术开源实现的框架，OpenR支持LLM通过高效的数据获取、训练和推理路径实现高级推理。它支持在线强化学习训练及多种搜索策略，并遵循测试时扩展原则，允许模型在测试时通过生成或搜索方式提供精细化输出。此外，OpenR提供自动化数据管道，从结果标签中提取推理步骤，从而减少人工标注工作量并确保收集有价值的信息。

本文分类：AI项目与工具
本文标签：开源强化学习大型语言模型推理能力自动化标注搜索算法过程监督数学问题求解自然语言处理教育辅助
浏览次数：553 次浏览
发布日期：2025-06-12 00:00:00
本文链接：https://sihangdaima.com/AIxiangmuyugongju/10978.html

评论列表共有 0 条评论

暂无评论

OpenR

评论列表 共有 0 条评论

发表评论 取消回复

评论列表共有 0 条评论

发表评论取消回复