当前位置:   article > 正文

【stable diffusion LORA训练】改进lora-scripts,命令行方式训练LORA,支持SDXL训练

lora-scripts

分享下自己改进的一个lora训练脚本,在ubuntu下如果SD-WEBUI的环境已经搭好的话,只需要下载lora-script就可以支持训练了,直接命令行方式训练。

首先,我们需要克隆下项目:

git clone https://github.com/Akegarasu/lora-scripts

其次,更改项目里的train.sh脚本如下

  1. #!/bin/bash
  2. # LoRA train script by @Akegarasu
  3. # Train data path | 设置训练用模型、图片
  4. #pretrained_model="/data/models/checkpoint/theAllysMixXSDXL_v10.safetensors" # base model path | 底模路径 #绘画风XL
  5. pretrained_model="/data/models/checkpoint/hellopure_V30a.safetensors" # base model path | 底模路径 #绘画风
  6. #pretrained_model="/data/models/checkpoint/orangechillmix_v70Fixed.safetensors" # base model path | 底模路径 #真实风
  7. is_v2_model=0 # SD2.0 model | SD2.0模型 2.0模型下 clip_skip 默认无效
  8. parameterization=0 # parameterization | 参数化 本参数需要和 V2 参数同步使用 实验性功能
  9. train_data_dir="/data/models/Train/image/" # train dataset path | 训练数据集路径
  10. reg_data_dir="" # directory for regularization images | 正则化数据集路径,默认不使用正则化图像。
  11. # Network settings | 网络设置
  12. network_module="networks.lora" # 在这里将会设置训练的网络种类,默认为 networks.lora 也就是 LoRA 训练。如果你想训练 LyCORIS(LoCon、LoHa) 等,则修改这个值为 lycoris.kohya
  13. network_weights="" # pretrained weights for LoRA network | 若需要从已有的 LoRA 模型上继续训练,请填写 LoRA 模型路径。
  14. network_dim=128 # network dim | 常用 4~128,不是越大越好
  15. network_alpha=128 # network alpha | 常用与 network_dim 相同的值或者采用较小的值,如 network_dim的一半 防止下溢。默认值为 1,使用较小的 alpha 需要提升学习率。
  16. #network_dim要和network_alpha一致,network_dim默认32,角色可以到96。画风可以到128,影响最终输出的模型文件尺寸
  17. # Train related params | 训练相关参数
  18. resolution="768,768" # image resolution w,h. 图片分辨率,宽,高。支持非正方形,但必须是 64 倍数。
  19. batch_size=4 # batch size
  20. max_train_epoches=8 # max train epoches | 最大训练 epoch,5~10,一般为6
  21. save_every_n_epochs=2 # save every n epochs | 每 N 个 epoch 保存一次
  22. #train_unet_only=1 # train U-Net only | 仅训练 U-Net,开启这个会牺牲效果大幅减少显存使用。6G显存可以开启,训SDXL可以考虑开启
  23. train_unet_only=0 # train U-Net only | 仅训练 U-Net,开启这个会牺牲效果大幅减少显存使用。6G显存可以开启
  24. train_text_encoder_only=0 # train Text Encoder only | 仅训练 文本编码器
  25. stop_text_encoder_training=0 # stop text encoder training | 在第N步时停止训练文本编码器
  26. noise_offset="0" # noise offset | 在训练中添加噪声偏移来改良生成非常暗或者非常亮的图像,如果启用,推荐参数为0.1
  27. keep_tokens=0 # keep heading N tokens when shuffling caption tokens | 在随机打乱 tokens 时,保留前 N 个不变。
  28. min_snr_gamma=0 # minimum signal-to-noise ratio (SNR) value for gamma-ray | 伽马射线事件的最小信噪比(SNR)值 默认为 0
  29. # Learning rate | 学习率
  30. lr="1e-4" # learning rate | 学习率,在分别设置下方 U-Net 和 文本编码器 的学习率时,该参数失效
  31. unet_lr="1e-4" # U-Net learning rate | U-Net 学习率
  32. text_encoder_lr="1e-5" # Text Encoder learning rate | 文本编码器 学习率
  33. lr_scheduler="cosine_with_restarts" # "linear", "cosine", "cosine_with_restarts", "polynomial", "constant", "constant_with_warmup", "adafactor"
  34. lr_warmup_steps=0 # warmup steps | 学习率预热步数,lr_scheduler 为 constant 或 adafactor 时该值需要设为0。
  35. lr_restart_cycles=1 # cosine_with_restarts restart cycles | 余弦退火重启次数,仅在 lr_scheduler 为 cosine_with_restarts 时起效。
  36. # 优化器设置
  37. optimizer_type="AdamW8bit" # Optimizer type | 优化器类型 默认为 AdamW8bit,可选:AdamW AdamW8bit Lion Lion8bit SGDNesterov SGDNesterov8bit DAdaptation AdaFactor prodigy
  38. # Output settings | 输出设置
  39. output_name="tblife-dzpg3" # output model name | 模型保存名称
  40. save_model_as="safetensors" # model save ext | 模型保存格式 ckpt, pt, safetensors
  41. # Resume training state | 恢复训练设置
  42. save_state=0 # save state | 保存训练状态 名称类似于 <output_name>-??????-state ?????? 表示 epoch 数
  43. resume="" # resume from state | 从某个状态文件夹中恢复训练 需配合上方参数同时使用 由于规范文件限制 epoch 数和全局步数不会保存 即使恢复时它们也从 1 开始 与 network_weights 的具体实现操作并不一致
  44. # 其他设置
  45. min_bucket_reso=256 # arb min resolution | arb 最小分辨率
  46. max_bucket_reso=1024 # arb max resolution | arb 最大分辨率
  47. persistent_data_loader_workers=1 # persistent dataloader workers | 保留加载训练集的worker,减少每个 epoch 之间的停顿
  48. clip_skip=2 # clip skip | 玄学 一般用 2
  49. multi_gpu=0 # multi gpu | 多显卡训练 该参数仅限在显卡数 >= 2 使用
  50. lowram=0 # lowram mode | 低内存模式 该模式下会将 U-net 文本编码器 VAE 转移到 GPU 显存中 启用该模式可能会对显存有一定影响
  51. # LyCORIS 训练设置
  52. algo="lora" # LyCORIS network algo | LyCORIS 网络算法 可选 lora、loha、lokr、ia3、dylora。lora即为locon
  53. conv_dim=4 # conv dim | 类似于 network_dim,推荐为 4
  54. conv_alpha=4 # conv alpha | 类似于 network_alpha,可以采用与 conv_dim 一致或者更小的值
  55. dropout="0" # dropout | dropout 概率, 0 为不使用 dropout, 越大则 dropout 越多,推荐 0~0.5, LoHa/LoKr/(IA)^3暂时不支持
  56. # 远程记录设置
  57. use_wandb=0 # use_wandb | 启用wandb远程记录功能
  58. wandb_api_key="" # wandb_api_key | API,通过 https://wandb.ai/authorize 获取
  59. log_tracker_name="" # log_tracker_name | wandb项目名称,留空则为"network_train"
  60. # 根据参数决定输出的文件和训练参数
  61. # 参数1为output_name 参数2不输则训练1.5的模型,输入"xl"则训练xl的模型,输入错误也还是训练1.5模型
  62. if [ -n "$1" ]; then
  63. output_name="$1"
  64. pretrained_model="/data/models/checkpoint/hellopure_V30a.safetensors" # 25D模型
  65. resolution="768,1024"
  66. train_unet_only=0
  67. batch_size=3
  68. xl_flag=0
  69. fi
  70. if [ "$2" = "xl" ]; then
  71. pretrained_model="/data/models/checkpoint/theAllysMixXSDXL_v10.safetensors" #25DXL模型
  72. resolution="768,896" #使用768,1024都会爆显存,催悲
  73. train_unet_only=1
  74. batch_size=1
  75. xl_flag=1
  76. fi
  77. echo "extend by @Jim[231203]"
  78. echo "==========将以以下参数训练模型=========="
  79. echo "输出文件:$output_name"
  80. echo "底模模型:$pretrained_model"
  81. echo "分辨率:$resolution"
  82. echo "批量大小:$batch_size"
  83. echo "训练深度:$network_dim"
  84. echo "总epoch:$max_train_epoches"
  85. echo "仅训练UNET:$train_unet_only"
  86. echo "========================================"
  87. # ============= DO NOT MODIFY CONTENTS BELOW | 请勿修改下方内容 =====================
  88. export HF_HOME="huggingface"
  89. export TF_CPP_MIN_LOG_LEVEL=3
  90. extArgs=()
  91. launchArgs=()
  92. if [[ $multi_gpu == 1 ]]; then launchArgs+=("--multi_gpu"); fi
  93. if [[ $is_v2_model == 1 ]]; then
  94. extArgs+=("--v2")
  95. else
  96. extArgs+=("--clip_skip $clip_skip")
  97. fi
  98. if [[ $parameterization == 1 ]]; then extArgs+=("--v_parameterization"); fi
  99. if [[ $train_unet_only == 1 ]]; then extArgs+=("--network_train_unet_only"); fi
  100. if [[ $train_text_encoder_only == 1 ]]; then extArgs+=("--network_train_text_encoder_only"); fi
  101. if [[ $network_weights ]]; then extArgs+=("--network_weights $network_weights"); fi
  102. if [[ $reg_data_dir ]]; then extArgs+=("--reg_data_dir $reg_data_dir"); fi
  103. if [[ $optimizer_type ]]; then extArgs+=("--optimizer_type $optimizer_type"); fi
  104. if [[ $optimizer_type == "DAdaptation" ]]; then extArgs+=("--optimizer_args decouple=True"); fi
  105. if [[ $save_state == 1 ]]; then extArgs+=("--save_state"); fi
  106. if [[ $resume ]]; then extArgs+=("--resume $resume"); fi
  107. if [[ $persistent_data_loader_workers == 1 ]]; then extArgs+=("--persistent_data_loader_workers"); fi
  108. if [[ $network_module == "lycoris.kohya" ]]; then
  109. extArgs+=("--network_args conv_dim=$conv_dim conv_alpha=$conv_alpha algo=$algo dropout=$dropout")
  110. fi
  111. if [[ $stop_text_encoder_training -ne 0 ]]; then extArgs+=("--stop_text_encoder_training $stop_text_encoder_training"); fi
  112. if [[ $noise_offset != "0" ]]; then extArgs+=("--noise_offset $noise_offset"); fi
  113. if [[ $min_snr_gamma -ne 0 ]]; then extArgs+=("--min_snr_gamma $min_snr_gamma"); fi
  114. if [[ $use_wandb == 1 ]]; then
  115. extArgs+=("--log_with=all")
  116. else
  117. extArgs+=("--log_with=tensorboard")
  118. fi
  119. if [[ $wandb_api_key ]]; then extArgs+=("--wandb_api_key $wandb_api_key"); fi
  120. if [[ $log_tracker_name ]]; then extArgs+=("--log_tracker_name $log_tracker_name"); fi
  121. if [[ $lowram ]]; then extArgs+=("--lowram"); fi
  122. #SDXL参数:1.train_unet_only必须打开(显存使用超过16G),(2.使用脚本sdxl_train_network.py),(3.使用参数--no_half_vae)
  123. #python -m accelerate.commands.launch ${launchArgs[@]} --num_cpu_threads_per_process=8 "./sd-scripts/sdxl_train_network.py" \
  124. if [[ $xl_flag == "1" ]]; then
  125. extArgs+=("--no_half_vae")
  126. script_file="sdxl_train_network.py"
  127. else
  128. script_file="train_network.py"
  129. fi
  130. python -m accelerate.commands.launch ${launchArgs[@]} --num_cpu_threads_per_process=8 "./sd-scripts/$script_file" \
  131. --enable_bucket \
  132. --pretrained_model_name_or_path=$pretrained_model \
  133. --train_data_dir=$train_data_dir \
  134. --output_dir="./output" \
  135. --logging_dir="./logs" \
  136. --log_prefix=$output_name \
  137. --resolution=$resolution \
  138. --network_module=$network_module \
  139. --max_train_epochs=$max_train_epoches \
  140. --learning_rate=$lr \
  141. --unet_lr=$unet_lr \
  142. --text_encoder_lr=$text_encoder_lr \
  143. --lr_scheduler=$lr_scheduler \
  144. --lr_warmup_steps=$lr_warmup_steps \
  145. --lr_scheduler_num_cycles=$lr_restart_cycles \
  146. --network_dim=$network_dim \
  147. --network_alpha=$network_alpha \
  148. --output_name=$output_name \
  149. --train_batch_size=$batch_size \
  150. --save_every_n_epochs=$save_every_n_epochs \
  151. --mixed_precision="fp16" \
  152. --save_precision="fp16" \
  153. --seed="1337" \
  154. --cache_latents \
  155. --prior_loss_weight=1 \
  156. --max_token_length=225 \
  157. --caption_extension=".txt" \
  158. --save_model_as=$save_model_as \
  159. --min_bucket_reso=$min_bucket_reso \
  160. --max_bucket_reso=$max_bucket_reso \
  161. --keep_tokens=$keep_tokens \
  162. --xformers --shuffle_caption ${extArgs[@]}

根据自己机器的显存适当调整下参数,例如我的16G显存的3070,就只能训练768x896的,然后根据1.5和SDXL的底模分开,这样就可以训练两个不同系列的大模型下的LORA了。区分起来很简单,命令行如下:

训练1.5的
nohup trainlora mylora &

训练SDXL的
nohup trainlora mylora xl &

对应的trainlora.sh如下(可以放到/usr/sbin下,输入命令直接启动):

  1. #!/bin/bash
  2. input_params=$@
  3. cd /root/sd-webui-aki-v4.4
  4. source venv/bin/activate
  5. cd /root/lora-scripts/
  6. ./train.sh $input_params

用起来相当方便,在开始训练时,还可以打印相关的训练参数,以免弄错(错了就是至少半个小时啊。。。)

注意:

1)里面的pretrained_model路径对应大模型底模,根据自己的需要修改

2)训练的素材,是放到/data/models/Train/下的,所有的大模型数据等被我单独挂载到一个独立分区了,image_bak是备份历史训练数据

3)训练完成后,lora文件会输出到lora-scripts/output/里

4)你可以用tail -f命令查看nohup.out了解训练进度

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/花生_TL007/article/detail/726364
推荐阅读
相关标签
  

闽ICP备14008679号