大模型Tuning分类_大模型各种 tunning

作者：盐析白兔 | 2024-04-04 16:09:46

踩

大模型各种 tunning

类型总结

语言模型的参数需要一起参与梯度更新

冻结了大部分预训练参数，仅添加任务层，语言模型层参数不变

Adapter在预训练模型每层中插入用于下游任务的参数，在微调时将模型主体冻结，仅训练特定于任务的参数，减少训练时算力开销

任务输入前添加一个自然语言任务指令和一些示例，直接在预训练语言模型中统一建模，比如GPT2/GPT3

将prompt方式扩展到连续空间，在每层输入序列前面添加prompt连续向量【随机初始化，并不对应到具体的token】目前是将语言模型freeze后，仅微调prompt参数，在实验中是增加了一个MLP重参数化，确保效果，使用MLP后的结果做预测

将prompt扩展到连续空间，但是仅在输入层加入prompt连续向量，且不固定，同时使用LSTM建模prompt向量之间的关联性

【P-tuning与Prefix-tuning】：

【P-tuning与fine-tuning】

P-tuning不改变预训练阶段模型参数，而是通过微调寻找更好的连续prompt提示，来引导已学习到的知识的使用；Fine-tuning可能在调整模型参数过程中，可能带来了灾难性遗忘问题

在第一版基础上，将每层输入都添加上prompt连续向量，同时探索了prompt长度在不同规模的模型上的效果；去掉MLP层重参数化

指令微调是会直接通过自然语言形式给出人类指令，是基于一组NLP任务集合上直接tuning的过程，它可以提高语言模型在未知任务上的效果，即zero-shot learning能力

【instruct-tuning 与 prompt-tuning】

二者目的都是挖掘语言模型本身已掌握的知识，prompt是激发语言模型补全能力，是针对某特定任务而言，不同的任务需要给出不同的表达形式；instruct则是激发语言模型的理解能力，是针对任务集合而形成的指令，它能通过理解做什么任务，在未可见任务上泛化能力更强【zero-shot learning】

语境提示微调是指结合LLM的ICL能力和prompt-tuning结合到指令提示微调中，将检索到的上下文演示示例和可微调的prompt嵌入式表征进行拼接，能够让LLM在医学领域方面获得不错的应用效果

声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：【wpsshop博客】