第三章：huggingface的Trainner参数解读_huggingface trainer参数

作者：小桥流水78 | 2024-07-24 15:51:27

踩

huggingface trainer参数

文章目录

前言
一、Trainer类部分参数来源你源码解读
二、Trainer初始化部分参数解读
总结

前言

大模型基本使用huggingface来实现。对于不太理解其内容基本按照官网教程或相关博客等来实现。想进一步激发开源大模型在行业领域提升性能是棘手问题。该问题会涉及开源代码二次开发进行实验测试。基于此，本教程不同文字或理论介绍内容，而从源码解读其训练逻辑、权重保存、高效微调方法(LoRA)、断点续训方法、模型推理权重处理等方法。本教程所有内容完全依托huggingface源码与相关Demo验证来解读，助力大模型使用。

本篇文章说明huggingface类Trainner部分参数来源与解读，提供一个参数查看模板。

一、Trainer类部分参数来源你源码解读

上一章，我们介绍了huggingface的TrainingArguments与trainner参数，仅从使用上给出说明。这里，我们从源码角度来说明参数来源或huggingface如何构建。

1、Trainer的self.args参数源码解读

我们从Trainer类的init函数中找到self.args参数代码(如下)。正如上一章所提供实列化Trainer类提供args=training_args的参数处理。如果不提供args，huggingface将会自动使用TrainingArguments类构建默认参数。至于TrainingArguments默认参数在上一章有说明，我将不在介绍。

 if args is None

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/小桥流水78/article/detail/875635