Pangea是由卡内基梅隆大学团队开发的一款多语言多模态大型语言模型(LLM),旨在增强全球语言和文化的多样性覆盖。该模型基于一个包含600万条指令的多样化数据集,支持39种语言,包括高质量的英文指令、机器翻译指令以及与文化相关的任务。其性能通过PangeaABench评估套件进行验证,该套件包含14个数据集,覆盖47种语言。研究表明,英语数据的比例、语言的流行程度以及多模态训练样本的数量对模型性能具有显著影响。 Pangea的核心功能包括多语言支持、多模态理解、跨文化覆盖以及高质量指令遵循。它能够理解和生成39种语言的文本,并在图像描述、视觉问答等多模态任务中表现出色。此外,Pangea在训练过程中融入了文化相关任务,提高了其对不同文化背景的理解和适应能力。 技术上,Pangea基于Pangea数据集构建,利用机器翻译技术扩展多语言数据资源。其模型架构基于LLaVA-Next,结合Qwen2-7B-Instruct作为语言模型的核心,赋予其强大的语言理解和生成能力。Pangea的性能通过PangeaABench评估套件进行全面评估,确保其在多语言和多模态任务中的卓越表现。
发表评论 取消回复