Pixtral Large是由法国Mistral AI团队开源的一款超大规模多模态模型,具备强大的图像理解能力。该模型基于Mistral Large 2开发,包含1230亿参数的多模态解码器和10亿参数的视觉编码器,能够处理文本、图像和图表等多种数据形式,并在多个基准测试中表现出色,优于其他主流模型。 其核心组件包括先进的多模态解码器和视觉编码器,后者采用变换器架构和自注意力机制,支持高效处理高分辨率图像。此外,Pixtral Large配备了128K的上下文窗口,可应对复杂的多图像场景和长篇文档。项目代码托管于HuggingFace和Mistral AI官网,方便开发者使用和集成。

评论列表 共有 0 条评论

暂无评论

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部