RAGEN

首页

RAGEN

列表

默认

浏览次数

发布日期

RAGEN

RAGEN是一款开源的强化学习框架，专为在交互式和随机环境中训练大型语言模型（LLM）推理代理而设计。它基于StarPO架构，支持多轮轨迹优化和多种强化学习算法，如PPO和GRPO。通过MDP形式化和渐进式奖励归一化策略，RAGEN提高了训练的稳定性和效率。其模块化设计支持多种环境，适用于智能对话、游戏AI、自动化推理等多个领域。

AI项目与工具 2025年06月11日 84 点赞 0 评论 778 浏览

RAGEN 首页 RAGEN

列表 默认 浏览次数 发布日期

RAGEN

RAGEN

首页

RAGEN

列表

默认

浏览次数

发布日期