DPO

ChatLearn

ChatLearn是一款由阿里云开发的高效对齐训练框架,支持多种对齐训练方法,包括RLHF、DPO、OnlineDPO和GRPO。它提供灵活的编程接口、资源调度机制和分布式计算支持,适用于自动化对话系统训练及复杂多模型训练场景。用户可以自定义模型执行流程,实现个性化训练策略。

Insight

Insight-V是一款由南洋理工大学、腾讯和清华大学联合研发的多模态大型语言模型,专为提升长链视觉推理能力而设计。该模型通过多智能体系统将任务分解为推理与总结两步,并采用两阶段训练流程优化性能。其渐进式数据生成和多粒度评估方法进一步提升了模型的推理精度,在多个视觉推理基准测试中表现出色。

MiniMind

MiniMind 是一款轻量级开源语言模型项目,具备极低的训练成本和高效的训练流程。其最小模型仅需 25.8M 参数,可在普通 GPU 上运行,支持多模态能力,如视觉语言模型 MiniMind-V。项目提供完整的训练代码,涵盖预训练、微调、LoRA、DPO 和模型蒸馏,兼容主流框架,适合初学者和开发者快速上手并应用于多个领域。

SolidPoint AI

SolidPoint是一个允许用户通过将冗长的视频压缩成简洁且富有信息的摘要,节省时间的AI工具。通过提取视频的关键思想,SolidPoint帮助用户专注于最重要的要点。