Pixtral Large

简介：Pixtral Large是一款由Mistral AI开源的超大规模多模态模型，具备1240亿参数，支持文本、图像和图表的理解与生成。它拥有128K的上下文窗口，能在多语言环境中处理复杂文档和多图像场景，广泛应用于教育、医疗、客服和内容审核等领域。

AI小编 768 阅读 0 评论 39 点赞

官网地址

Pixtral Large是由法国Mistral AI团队开源的一款超大规模多模态模型，具备强大的图像理解能力。该模型基于Mistral Large 2开发，包含1230亿参数的多模态解码器和10亿参数的视觉编码器，能够处理文本、图像和图表等多种数据形式，并在多个基准测试中表现出色，优于其他主流模型。其核心组件包括先进的多模态解码器和视觉编码器，后者采用变换器架构和自注意力机制，支持高效处理高分辨率图像。此外，Pixtral Large配备了128K的上下文窗口，可应对复杂的多图像场景和长篇文档。项目代码托管于HuggingFace和Mistral AI官网，方便开发者使用和集成。

本文分类：AI项目与工具
本文标签：多模态模型图像理解文本生成视觉编码器自注意力机制上下文窗口开源项目多语言支持医疗影像内容审核
浏览次数：768 次浏览
发布日期：2025-06-12 00:00:00
本文链接：https://sihangdaima.com/AIxiangmuyugongju/10325.html

评论列表共有 0 条评论

暂无评论

Pixtral Large

评论列表 共有 0 条评论

发表评论 取消回复

评论列表共有 0 条评论

发表评论取消回复