Hunyuan

简介：Hunyuan-Large是一款由腾讯开发的大规模混合专家（MoE）模型，以其庞大的参数量成为当前参数规模最大的开源MoE模型之一。该模型基于Transformer架构，擅长处理长文本任务，同时在多语言自然语言处理、代码生成以及数学运算等领域展现出色性能。通过合成数据增强训练与创新的注意力机制，Hunyuan-Large实现了高效的推理吞吐量，并广泛应用于内容创作、教育辅助、知识问答及数据分析等多

AI小编 491 阅读 0 评论 69 点赞

项目地址

Hunyuan-Large是由腾讯推出的一款大规模混合专家（MoE）模型，拥有3890亿总参数量和520亿激活参数量，是当前业界参数规模最大的开源MoE模型之一。基于Transformer架构，该模型能够支持长达256K的文本序列输入，显著提升了对长文本任务的处理能力。在长上下文处理、中英文自然语言处理、代码生成及数学运算等方面，Hunyuan-Large表现优异，超越了许多主流开源模型如Llama3和Mixtral。通过使用高质量合成数据进行训练，并结合合成数据增强技术，模型能够学习到更为丰富的特征表达，从而更好地适应新数据。此外，它还采用了分组查询注意力（GQA）与跨层注意力（CLA）机制，有效降低了KV缓存所需的内存占用及计算成本，进一步优化了推理性能。

本文分类：AI项目与工具
本文标签：AI MoE模型大规模参数 Transformer架构长文本处理合成数据增强分组查询注意力跨层注意力自然语言处理代码生成
浏览次数：491 次浏览
发布日期：2025-06-12 00:00:00
本文链接：https://sihangdaima.com/AIxiangmuyugongju/10553.html

评论列表共有 0 条评论

暂无评论

Hunyuan

评论列表 共有 0 条评论

发表评论 取消回复

评论列表共有 0 条评论

发表评论取消回复