当前位置:   article > 正文

从零开始训练大模型

从零开始训练大模型

【LLM】从零开始训练大模型 - 知乎​​​​​​

包括模型预训练(Pretrain)、Tokenizer 训练、指令微调(Instruction Tuning)、奖励模型(Reward Model)和强化学习(RLHF)等

Pretraining 的思路很简单,就是输入一堆文本,让模型做 Next Token Prediction 的任务

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/我家小花儿/article/detail/172013?site
推荐阅读
相关标签
  

闽ICP备14008679号