Firefly调参Baichuan13B_peft lora微调baichuan-13b

作者：羊村懒王 | 2024-05-14 08:02:41

踩

peft lora微调baichuan-13b

Qlora微调

如果使用LoRA或者QLoRA进行训练，本项目仅保存adapter的权重和配置文件，需要将adapter权重与base model进行合并。脚本见script/merge_lora.py，

在script文件下执行python merge_lora.py

CUDA_VISIBLE_DEVICES=0 torchrun --nproc_per_node=1 train_qlora.py --train_args_file train_args/qlora/baichuan-13b-sft-qlora.json

首先修改Firefly/script/chat/中的single_chat.py文件

运行single_chat.py文件

CUDA_VISIBLE_DEVICES=0 python single_chat.py

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/羊村懒王/article/detail/568055