搜索
查看
编辑修改
首页
UNITY
NODEJS
PYTHON
AI
GIT
PHP
GO
CEF3
JAVA
HTML
CSS
搜索
weixin_40725706
这个屌丝很懒,什么也没留下!
关注作者
热门标签
jquery
HTML
CSS
PHP
ASP
PYTHON
GO
AI
C
C++
C#
PHOTOSHOP
UNITY
iOS
android
vue
xml
爬虫
SEO
LINUX
WINDOWS
JAVA
MFC
CEF3
CAD
NODEJS
GIT
Pyppeteer
article
热门文章
1
机器学习、深度学习笔试题面试题整理_人工智能 & 机器学习 & 深度学习】基础选择题1~30题 练习 | 人工智能 面试题:请介
2
20万DBA都在关注的12个问题丨DBASK回答集萃第七期_12c ogg 10g
3
基于C++的定时获取网页+源代码_c++ 获取360网页源代码
4
10.windows ubuntu 组装软件:spades,megahit
5
java 分词搜索功能_给全文搜索引擎Manticore (Sphinx) search 增加中文分词
6
关于胶质母细胞瘤的影像组学和影像基因组学
7
python英文文本词性分析_python 输出英语单词词性
8
清华裴丹|大模型时代的AIOps
9
Attentional Feature Fusion 注意力特征融合_注意力融合
10
在文本关键词提取中TF-IDF和TextRank算法结合使用的步骤_基于tf-idf算法和texttabk算法的文本特征提取
当前位置:
article
> 正文
PEFT(参数高效微调)_参数高效微调(peft)
作者:weixin_40725706 | 2024-04-05 10:21:29
赞
踩
参数高效微调(peft)
PEFT现在的方法总览
Seletive
Adapter
LoRA: Low-Rank Adaptation of Large Language Models(低秩微调大模型) (ICLR 2022)
差距大的任务,增大rank可能带来性能提升
优点
+稳定
+可以同时用LoRA+adaptor etc
prompt tuning
1.介绍
背景
何为prompt tuning
2. 编写prompt(prompt design) 2个原则
2.1 编写明确提示
2.1.1长的clear的指令>短的指令
2.1.2分隔符
2.1.3结构化输出(JSON和HTML)
2.2给LLM足够时间思考
2.2.1指定完成任务的步骤(Chain-of thought)
2.2.2 在让模型做出决策前先思考 自己的解决方案
2.2.3给定指定的示例,few-shot
2.3.1幻觉 (由于并没有记住每一个话,所以会有合理但不正确真实的回答)
比如模型会创造一个相当逼真的虚构的产品名称描述
追溯文档可以减少幻觉
2.2.4 角色扮演
弊端
多数偏差和最近偏差
幻象
3.学习prompt(prompt tuning)
只调propmt的文本 (Tuning-free prompting)
把prompt embed之后,训练prompt的词向量 (现在prompt tuning基本上是这种 )
Pre-trained Prompt Tuning for Few-shot Learning (ACL 2022) 、The Power of Scale for Parameter-Efficient Prompt Tuning (EMNLP 2021)
效果
Soft prompt和hard prompt
所以 有按任务做不同的预训练prompt(用作初始化)
预训练prompt的具体方法
视觉的visual prompt tuning
VPT:就是NLP中加前缀Prefix,然后只用训练前缀。的给定一个预先训练好的Transformer,在Embed层后的输入空间引入一组d维的p连续embedding。在微调过程中,只有prompt会被更新,主干将会冻结,
加像素),结果比传统的fine_tuning即Linear probe甚至full fine-tuning好,参数量和adapter差不多(
视觉-文本多模态prompt
CoOp: Learning to Prompt for Vision-Language Models
用到再说了
三种PRFT方法的实现
总结:
+LoRA可以合用
留坑:CoT,ToT,GoT的prompt方法
声明:
本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:
https://www.wpsshop.cn/w/weixin_40725706/article/detail/365031
推荐阅读
article
潮起风来,
政企
DICT
“跃升”之
乘风破浪
篇_怎样缩短
dict
项目
的
交付
时长...
一线技术人
的
经验总结_怎样缩短
dict
项目
的
交付
时长怎样缩短
dict
项目
的
交付
时长 大争之世,非...
赞
踩
article
K8S-
Deployment
的滚动
更新
Rolling
Update
...
结果是 deployment 和 rs 的属性都
更新
了, 而且pod 也增加了两个, 但是实际上rs 的hash 没变,...
赞
踩
article
2024届
计算机
保研
经验贴(
计算所
,
复旦
,南大,
哈工大
,天大、
西交
等等)(2023年)_
西交
直博
和中...
2024届
保研
经验贴_
西交
直博
和
中九学硕
西交
直博
和
中九学硕
首先...
赞
踩
article
k8s
存储
emptyDir
hostPath
PvPvc_
pvc
使用hostpath...
背景容器磁盘上的文件的生命周期是短暂的,这就使得在容器中运行重要应用时会出现一些问题。首先,当容器崩溃时,kubelet...
赞
踩
article
深入了解
LLaMA
大
模型
_
llama
模型
用途...
通过阅读源代码,研究者们可以更好地理解
LLaMA
大
模型
的工作原理和内部机制,从而基于
LLaMA
进行定制化开发,满足特定领...
赞
踩
article
Docker简介_
docker
关键技术
...
目录1、什么是
docker
:2、
docker
优点?3、
docker
应用场景4、
docker
组成5、与虚拟机的区别6、do...
赞
踩
article
appium
最全
安装
指南_
appium
安装
...
为什么选择
appium
?
appium
介绍:可以测试原生应用,混合页面应用,移动网页应用,跨平台,达到一套脚本针对不同平台...
赞
踩
article
【项目实战】常见
的
HTTP
状态码(
401
-
Unauthorized
)_
401
unauthori...
400 Bad Request是一种
HTTP
状态码。400 Bad Request" 是一个常见
的
HTTP
错误代码400...
赞
踩
article
【
自然语言
处理
】
NLP
入门(九):1、
正则表达式
与
Python
中的实现(9):
自
动机
:⾮确定
有限
⾃动...
本文介绍了
自
动机
理论,简介
有限
自
动机
(Finite Automata, FA)、下推
自
动机
(Push-down Auto...
赞
踩
article
大
模型
常见
面试题
3...
大
模型
常见
面试题
,如transformer,NLP等大
模型
常见
面试题
3 ...
赞
踩
article
【
C语言
】
C语言
编程实战:
Base64
编解码
算法
从理论到实现(附
完整
代码
)_
base64
keilc
...
base64
算法
原理讲解和
C语言
代码
实现_
base64
keilc
base64
keilc
...
赞
踩
article
人工智能
主要
分支
_
人工智能
分为哪三个
领域
...
人工智能
主要
分支
1
主要
分支
介绍通讯、感知与行动是现代
人工智能
的三个关键能力,在这里我们将根据这些能力/应用对这三个技术...
赞
踩
article
Jackson
注解
及配置大全_
jackson
常用
注解
...
Jackson
注解
及配置大全_
jackson
常用
注解
jackson
常用
注解
...
赞
踩
article
BERT
模型
和代码解析...
1 前言本期内容,笔者想解析一下自然语言处理(NLP)中非常有名的基于变换器的双向编码器表示技术(即Bidirectio...
赞
踩
article
LLM - 搭建 DrugGPT 结合药物化学分子知识的
ChatGPT
系统_
drugchat
: ...
DrugChat,基于图神经网络和大型语言模型的原型系统,能够实现类似
ChatGPT
的功能,对药物分子图进行交互式问答和...
赞
踩
article
CorelDRAW
Graphics
Suite2024
完整版
最新功能介绍_
cdr2024
版本...
CorelDRAW
平面设计软件通常也被叫做CDR,CDR广泛应用于排版印刷、矢量图形编辑及网页设计等领域。通过Corel...
赞
踩
article
Matlab
:利用
1D
-
CNN
(
一维
卷积
神经网络
),分析高光谱曲线
数据
或时序
数据
_1d
cnn
卷积
神...
介绍关于
1D
-
CNN
的特点与应用,分享了不同结构的
1D
CNN
,包含创建代买和训练代码。_1d
cnn
卷积
神经网络
大气1...
赞
踩
article
HuggingFace
——
Trainer
的简单使用_
huggingface
trainer
...
HuggingFace
——
Trainer
的简单使用_
huggingface
trainer
huggingface
tra...
赞
踩
article
黑客
入门
教程
(非常详细)从零
基础
入门
到精通
,
看完这一篇就够
了
...
首先要明白啊
,
我们现在说的
黑客
不是那种窃取别人信息、攻击别人系统的
黑客
,
说的是调试和分析计算机安全系统的网络安全工程师。...
赞
踩
article
大创
项目
推荐 深度学习
python
opencv
火焰
检测
识别
...
大创
项目
推荐 深度学习
python
opencv
火焰
检测
识别
...
赞
踩
相关标签
网络
kubernetes
容器
经验分享
程序人生
人工智能
考研
k8s
volume
hostPath
pvpvc
emptyDir
llama
自然语言处理
大模型
docker
运维
http
网络协议
python
正则表达式
自动机
有限自动机
nlp