自蒸馏技术在语言模型微调中的桥梁作用

作者：爱喝兽奶帝天荒 | 2024-08-06 07:44:39

踩

自蒸馏技术在语言模型微调中的桥梁作用

论文：https://arxiv.org/pdf/2402.13669
代码：https://github.com/sail-sg/sdft
机构：浙江大学、Sea AI Labs和腾讯
领域：模型微调
发表：ACL2024

这篇论文的标题是《Self-Distillation Bridges Distribution Gap in Language Model Fine-Tuning》，作者们探讨了在对大型语言模型（LLMs）进行微调（fine-tuning）以适应特定任务时遇到的挑战，尤其是如何在提升任务性能的同时保留模型的通用指令遵循能力。论文提出了一种新颖的微调方法——自蒸馏微调（Self-Distillation Fine-Tuning，简称SDFT），旨在通过引导微调过程使用模型自身生成的、与

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/爱喝兽奶帝天荒/article/detail/936468