Lora 微调wiki_lora add_mixin

作者：你好赵伟 | 2024-04-01 15:54:26

踩

lora add_mixin

Lora 微调wiki

背景

大公司或者研究机构，都是有足够资源的来开发大模型，但是对于一般的小公司或者个人来说，要想开发自己的大模型几乎不可能，要知道像 ChatGPT 这样的大模型，一次训练的成本就在上千亿美元。

目前主流的方法包括2019年 Houlsby N 等人提出的 Adapter Tuning，2021年微软提出的 LORA，斯坦福提出的 Prefix-Tuning，谷歌提出的 Prompt Tuning，2022年清华提出的 P-tuning v2

这些方法都有各自的特点，从个人使用情况来说，LORA 的效果会好于其它几种方法。其它方法都有各自的一些问题：

核心：模型是过参数化的，它们有更小的内在维度，模型主要去依赖这个低的内在维度去做任务适配。

通俗理解：你从小到大经历了很多很多的事情，比如目前正在经历繁琐又复杂的成年人

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/你好赵伟/article/detail/349539