当前位置:   article > 正文

大模型-DeltaTuning-增量式01:Adapter-tuning(0.5-8%)【每个transformer层内加入2个Adapter层】【Adapter就是先降维再升维的全连接】_delta tuning adapter

delta tuning adapter

Adapter Tuning

随着计算机硬件性能的提高,预训练模型参数量越来越多,在训练下游任务时进行全模型微调变得昂贵且耗时,Adapter 的出现缓解了这个问题。Adapter在预训练模型每层中插入用于下游任务的参数,在微调时将模型主体冻结,仅训练特定于任务的参数,减少训练时算力开销。

Adapter模块设计方法

 2019年,Houlsby N等人将Adapter引入NLP领域,作为全模型微调的一种替代方案。Adapter主体架构下图所示。




预训练模型微调 | 一文带你了解Adapter Tuning - 知乎

声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:【wpsshop博客】
推荐阅读
相关标签
  

闽ICP备14008679号