Infinity

简介：Infinity-MM是智源研究院发布的千万级多模态指令数据集，包含4300万条样本，涵盖视觉问答、文字识别、文档分析及数学推理等多领域任务。它通过严格的筛选和去重保证数据质量，并采用合成数据生成技术扩展数据集规模。基于此数据集，智源研究院训练出了20亿参数的Aquila-VL-2B模型，在多项基准测试中表现出色，推动了多模态AI领域的研究与发展。

AI小编 684 阅读 0 评论 87 点赞

官网地址

Infinity-MM是由智源研究院开发的千万级多模态指令数据集，包含超过4300万条样本，总数据量达到10TB。该数据集经过严格的质量过滤和去重处理，确保了数据的高质与多样性，能够显著提升开源视觉-语言模型（VLMs）的表现。智源研究院还提出了基于开源VLMs的合成数据生成方法，进一步扩展了数据集的规模和多样性。以此为基础，智源成功训练出一款20亿参数的多模态模型Aquila-VL-2B，其性能在同类规模的模型中处于领先地位。

本文分类：AI项目与工具
本文标签：多模态指令数据集视觉-语言模型数据增强开源模型合成数据生成多模态架构分阶段训练训练效率优化文档理解数学推理
浏览次数：684 次浏览
发布日期：2025-06-12 00:00:00
本文链接：https://sihangdaima.com/AIxiangmuyugongju/10472.html

评论列表共有 0 条评论

暂无评论

Infinity

评论列表 共有 0 条评论

发表评论 取消回复

评论列表共有 0 条评论

发表评论取消回复