赞
踩
+ 17. 微调后的模型出现能力劣化,灾难性遗忘是怎么回事? + 18. 微调模型需要多大显存? + 19. 大模型LLM进行SFT操作的时候在学习什么? + 20. 预训练和SFT操作有什么不同 + 21. 样本量规模增大,训练出现OOM错 + 22. 大模型LLM进行SFT 如何对样本进行优化? + 23. 模型参数迭代实验