赞
踩
适配器是一种轻量级模块,插入到预训练模型的各层之间。
适配器模块通常包括一个降维层、非线性激活函数和一个升维层。
插入适配器模块:在预训练模型的每一层之间插入适配器模块。
冻结原模型参数:在微调过程中,预训练模型的参数保持不变。
更新适配器参数:只更新适配器模块的参数,使模型能够适应特定的下游任务。
适配器模块通常很小,增加的参数量较少。
适配器模块可以灵活地插入到不同层次,适应不同的任务需求。
在一个预训练的 BERT 模型中,每个 Transformer 层之间插入适配器模块。在微调过程中,只更新这些适配器模块的参数,而 BERT 模型的参数保持不变。
在一个预训练的 Transformer 模型中,将每个权重矩阵分解为两个低秩矩阵。在微调过程中,只更新这些低秩矩阵的参数,而原始权重矩阵保持不变。
提示微调(Prompt Tuning)通过在输入点或中间层前置一组可学习的提示 tokens,并在微调过程中只优化这些 tokens 的参数,从而实现参数高效的微调方法。这种方法不仅减少了需要更新的参数数量,还保持了预训练模型的完整性和性能。
假设我们有一个预训练的 GPT-3 模型,我们希望使用提示微调方法来进行情感分析任务。
步骤:
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。