Qwen2

简介：Qwen2是由阿里云通义千问团队开发的大型语言模型系列，涵盖从0.5B到72B的不同规模版本。该系列模型在自然语言理解、代码编写、数学解题及多语言处理方面表现出色，尤其在Qwen2-72B模型上，其性能已超过Meta的Llama-3-70B。Qwen2支持最长128K tokens的上下文长度，并已在Hugging Face和ModelScope平台上开源。 ---

AI小编 655 阅读 0 评论 48 点赞

项目地址

Qwen2是由阿里云通义千问团队开发并开源的一种大型语言模型。该系列模型包括从0.5B到72B的不同规模版本，覆盖了多种语言，特别是增加了27种语言的高质量数据，显著提升了自然语言理解、代码编写、数学解题及多语言处理的能力。Qwen2支持最长128K tokens的上下文长度，进一步优化了模型的泛化性和应用潜力。该系列模型在多个评测基准上表现出色，尤其是在Qwen2-72B模型上，其性能已超过Meta的Llama-3-70B。Qwen2系列模型已在Hugging Face和ModelScope平台上开源。 ---

本文分类：AI项目与工具
本文标签：大型语言模型自然语言处理代码编写数学解题多语言处理上下文长度阿里云开源性能评测泛化性
浏览次数：655 次浏览
发布日期：2024-01-01 00:00:00
本文链接：https://sihangdaima.com/AIxiangmuyugongju/11641.html

上一篇 > Stability AI开源Stable Diffusion 3 Medium文生图模型
下一篇 > Codestral

评论列表共有 0 条评论

暂无评论

Qwen2

评论列表 共有 0 条评论

发表评论 取消回复

评论列表共有 0 条评论

发表评论取消回复