Pangea

简介：Pangea是一款由卡内基梅隆大学团队开发的多语言多模态大型语言模型，支持39种语言，具备多模态理解和跨文化覆盖能力。其主要功能包括多语言文本生成与理解、图像描述、视觉问答等，同时通过高质量指令和文化相关任务优化性能。Pangea基于丰富的数据集和先进的模型架构，适用于多语言客户服务、教育、跨文化交流等多个领域。

AI小编 487 阅读 0 评论 11 点赞

项目地址

Pangea是由卡内基梅隆大学团队开发的一款多语言多模态大型语言模型（LLM），旨在增强全球语言和文化的多样性覆盖。该模型基于一个包含600万条指令的多样化数据集，支持39种语言，包括高质量的英文指令、机器翻译指令以及与文化相关的任务。其性能通过PangeaABench评估套件进行验证，该套件包含14个数据集，覆盖47种语言。研究表明，英语数据的比例、语言的流行程度以及多模态训练样本的数量对模型性能具有显著影响。 Pangea的核心功能包括多语言支持、多模态理解、跨文化覆盖以及高质量指令遵循。它能够理解和生成39种语言的文本，并在图像描述、视觉问答等多模态任务中表现出色。此外，Pangea在训练过程中融入了文化相关任务，提高了其对不同文化背景的理解和适应能力。技术上，Pangea基于Pangea数据集构建，利用机器翻译技术扩展多语言数据资源。其模型架构基于LLaVA-Next，结合Qwen2-7B-Instruct作为语言模型的核心，赋予其强大的语言理解和生成能力。Pangea的性能通过PangeaABench评估套件进行全面评估，确保其在多语言和多模态任务中的卓越表现。

本文分类：AI项目与工具
本文标签：多语言多模态文化多样性跨文化交流语言模型指令优化视觉问答跨文化理解机器翻译开源模型
浏览次数：487 次浏览
发布日期：2025-06-12 00:00:00
本文链接：https://sihangdaima.com/AIxiangmuyugongju/10195.html

评论列表共有 0 条评论

暂无评论

Pangea

评论列表 共有 0 条评论

发表评论 取消回复

评论列表共有 0 条评论

发表评论取消回复