【通义千问】大模型Qwen GitHub开源工程学习笔记（5）-- 模型的微调【全参数微调】【LoRA方法】【Q-LoRA方法】_qwen大模型微调

作者：小桥流水78 | 2024-07-23 16:38:38

踩

qwen大模型微调

摘要：

本文介绍了使用微调技术进行自然语言生成的方法。通过使用transformers库中的AutoModelForCausalLM和AutoTokenizer，可以在多节点环境下进行微调。

训练数据的准备

你需要将所有样本放到一个列表中并存入json文件中。每个样本对应一个字典，包含id和conversation，其中后者为一个列表。示例如下所示：


[
  {
    "id": "identity_0",
    "conversations": [
      {
        "from": "user",
        "value": "你好"
      },
      {
        "from": "assistant",
        "value": "我是一个语言模型，我叫通义千问。"
      }
    ]
  }
]

微调方法分析

微调脚本能够帮你实现三种微调方法：

全参数微调
LoRA
Q-LoRA

【全参数微调在训练过程中更新所有参数。】

"全参数微调"是一种在机器学习中用于优化预训练模型的技术。这种技术涉及在特定数据集上继续训练，更新模型的所有参数，以提高模型在特定任务上的性能。"参数"在这里指的是模型中的权重和偏置，它们决定了模型的行为和输出。在训练过程中，通过不断调整这些参数，模型

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/小桥流水78/article/detail/870705