赞
踩
链接:https://zhuanlan.zhihu.com/p/635686756
答案:冻结不需要更新的参数
答案:bitfit的主要思想是改变某些层中的bias参数
答案:离散的模板在自然语言处理(NLP)任务中,尤其是在与预训练语言模型交互时,是指以自然语言文本形式编写的固定提示或框架,用来引导模型生成特定的输出。这种模板是由人类直接设计或通过自动化方法生成的,由于其离散性和固定性,称为“离散的模板”。 离散性是因为它们由固定的、不可分割的自然语言单元组成,具有明确的边界,并且在使用时作为一个整体来使用,不可分割。
答案:指的是在输入数据的前面加上可以预训练的向量,在整个过程中进行迭代
答案:定义1:离散的Token是自然语言文本中单词或子词(subword)的离散表示。它们是自然语言的符号化表示,每个Token对应于特定的词或子词。 定义2:连续可微的Virtual Token是一种可训练的向量表示,它不对应具体的词语或子词,而是作为模型输入的一部分,通过训练来优化,以实现特定的任务。这些向量是连续的,并且可以通过梯度下降等优化方法进行微调。
答案:hard prompt:指的是用自然语言提供的提示词,例如”请给我写一段python程序“ soft prompt:指的是连续可微的,可以用梯度下降算法进行优化的向量,这些向量一开始是初始化的,需要经过数据集来进行训练的,训练完成了之后就变成了提示词。具体有:prefix tuning和prompt tuning
答案:和Prefix Tuning类似,但是Prompt Tuning可以添加到输入数据的各个位置,不仅仅是前缀。
答案:可以说消融实验在某种程度上借鉴了控制变量法的思想。虽然两者应用在不同的领域和上下文中,它们的核心思想——通过系统性地改变某些因素来研究其对整体结果的影响——是相似的。
答案:为了解决问题9,来举个例子,对于情感分析,
样本1:今天天气真好;样本2:我的心情很糟糕。
样本词汇表初始化会提取真好和糟糕作为初始化条件,来初始化相应的virtual token
类别初始化会用类别正面和负面作为初始化条件,来初始化相应的virtual token
答案:见问题4和问题7
答案:主要讲了bias、prefix tuning、prompt tuning是什么以及技术原理是什么,没有认知上的收获
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。