DianJin-R1是由阿里云通义点金团队与苏州大学合作开发的金融领域推理增强型大模型,专为提升金融任务中的推理能力而设计。该模型基于先进的技术架构和丰富的数据支持,通过推理增强监督学习和强化学习方法,显著提升了在金融场景下的表现。其核心是DianJin-R1-Data数据集,整合了CFLUE、FinQA以及中国合规检查(CCC)等多个高质量数据源,覆盖广泛的金融推理任务。 DianJin-R1提供两个版本:DianJin-R1-7B和DianJin-R1-32B,均经过监督微调(SFT)和强化学习(RL)两阶段优化,并采用组相对策略优化(GRPO)算法,结合双重奖励机制,以提高推理质量。在多个金融基准测试中,如CFLUE、FinQA和CCC,DianJin-R1表现出优于传统模型的能力,尤其在单次调用中实现了接近甚至超越多代理系统的性能,同时具备更低的计算成本。 DianJin-R1支持结构化推理输出,能够清晰展示推理过程和最终答案,便于理解和应用。其应用场景涵盖金融风险评估、合规检查、客户服务、考试辅助及复杂决策支持等,适用于多种金融业务需求。

评论列表 共有 0 条评论

暂无评论

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部