当前位置:   article > 正文

ai训练总结_pretrain finetune

pretrain finetune

batchsize算法:4*1*8卡
    loss:收敛越来越小
    精度如何看
        没有精度值,看loss值,越来越小,收敛到一定规模(pretrain 0.00x,finetune收敛到1.7~1.8
    pretrain和finetune的区别
            参数规模:pretrain全参数量一起训练、lora是使用一部分参数来训练

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/凡人多烦事01/article/detail/732186
推荐阅读
相关标签
  

闽ICP备14008679号