DELIFT(Data Efficient Language model Instruction Fine-Tuning)是一种创新的算法,旨在通过优化大型语言模型(LLMs)在指令调优、任务特定微调及持续微调阶段的数据选择,实现高效的数据利用。该方法基于成对效用度量与次模优化技术,能够从大规模数据集中挑选出多样化且最优的数据子集,从而显著降低计算资源的消耗,同时确保或提升模型性能。实验结果表明,DELIFT可将微调所需的训练数据量减少约70%,并大幅提高计算效率。

评论列表 共有 0 条评论

暂无评论

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部