DPO - 智狐AI导航

ChatLearn

ChatLearn是一款由阿里云开发的高效对齐训练框架，支持多种对齐训练方法，包括RLHF、DPO、OnlineDPO和GRPO。它提供灵活的编程接口、资源调度机制和分布式计算支持，适用于自动化对话系统训练及复杂多模型训练场景。用户可以自定义模型执行流程，实现个性化训练策略。

AI项目与工具 2025年06月12日 90 点赞 0 评论 577 浏览

Insight

Insight-V是一款由南洋理工大学、腾讯和清华大学联合研发的多模态大型语言模型，专为提升长链视觉推理能力而设计。该模型通过多智能体系统将任务分解为推理与总结两步，并采用两阶段训练流程优化性能。其渐进式数据生成和多粒度评估方法进一步提升了模型的推理精度，在多个视觉推理基准测试中表现出色。

AI项目与工具 2025年06月12日 98 点赞 0 评论 683 浏览

MiniMind

MiniMind 是一款轻量级开源语言模型项目，具备极低的训练成本和高效的训练流程。其最小模型仅需 25.8M 参数，可在普通 GPU 上运行，支持多模态能力，如视觉语言模型 MiniMind-V。项目提供完整的训练代码，涵盖预训练、微调、LoRA、DPO 和模型蒸馏，兼容主流框架，适合初学者和开发者快速上手并应用于多个领域。

AI项目与工具 2025年06月12日 77 点赞 0 评论 910 浏览

SolidPoint AI

SolidPoint是一个允许用户通过将冗长的视频压缩成简洁且富有信息的摘要，节省时间的AI工具。通过提取视频的关键思想，SolidPoint帮助用户专注于最重要的要点。

格式转换 2025年06月05日 53 点赞 0 评论 863 浏览

DPO

首页

DPO

列表

默认

浏览次数

发布日期

ChatLearn

Insight

MiniMind

SolidPoint AI

DPO 首页 DPO

列表 默认 浏览次数 发布日期

ChatLearn

Insight

MiniMind

SolidPoint AI

DPO

首页

DPO

列表

默认

浏览次数

发布日期