Qwen2是由阿里云通义千问团队开发并开源的一种大型语言模型。该系列模型包括从0.5B到72B的不同规模版本,覆盖了多种语言,特别是增加了27种语言的高质量数据,显著提升了自然语言理解、代码编写、数学解题及多语言处理的能力。Qwen2支持最长128K tokens的上下文长度,进一步优化了模型的泛化性和应用潜力。该系列模型在多个评测基准上表现出色,尤其是在Qwen2-72B模型上,其性能已超过Meta的Llama-3-70B。Qwen2系列模型已在Hugging Face和ModelScope平台上开源。 ---
发表评论 取消回复