Delta

简介：Delta-CoMe是一种由清华大学NLP实验室牵头研发的增量压缩算法，它通过低秩分解与混合精度量化技术，显著减少了大型语言模型的存储和内存需求，同时保持了模型性能几乎无损。该工具支持多任务处理、推理加速，并广泛适用于云计算、边缘计算及学术研究等领域，特别擅长应对数学、代码和多模态任务。

AI小编 314 阅读 0 评论 58 点赞

项目地址

Delta-CoMe是由清华大学NLP实验室联合OpenBMB开源社区、北京大学及上海财经大学共同开发的一种创新性增量压缩算法。该算法能够使单个80G A100 GPU支持同时加载多达50个7B规模的语言模型，相较于传统方法，其显存利用率提升了约8倍，且模型性能几乎与未压缩的微调模型一致。Delta-CoMe通过结合低秩分解与低比特量化技术，利用模型参数增量（Delta）的低秩特性，实现了高效的混合精度压缩。这种方法不仅大幅降低了模型的存储和推理成本，还在处理数学、代码以及多模态等复杂任务时表现优异。

本文分类：AI项目与工具
本文标签：AI工具模型压缩混合精度量化低秩分解推理加速多任务处理边缘计算学术研究开源项目大型语言模型
浏览次数：314 次浏览
发布日期：2025-06-12 00:00:00
本文链接：https://sihangdaima.com/AIxiangmuyugongju/10077.html

评论列表共有 0 条评论

暂无评论

Delta

评论列表 共有 0 条评论

发表评论 取消回复

评论列表共有 0 条评论

发表评论取消回复