OThink-MR1

首页

OThink-MR1

列表

默认

浏览次数

发布日期

OThink

OThink-MR1是由OPPO研究院与香港科技大学（广州）联合研发的多模态语言模型优化框架，基于动态KL散度策略（GRPO-D）和奖励模型，提升模型在视觉计数、几何推理等任务中的泛化与推理能力。其具备跨任务迁移能力和动态平衡探索与利用机制，适用于智能视觉问答、图像描述生成、内容审核等多个领域，具有广阔的应用前景。

AI项目与工具 2025年06月12日 21 点赞 0 评论 912 浏览

OThink-MR1 首页 OThink-MR1

列表 默认 浏览次数 发布日期

OThink

OThink-MR1

首页

OThink-MR1

列表

默认

浏览次数

发布日期