当前位置:   article > 正文

python-中文闲聊的GPT2模型首次使用笔记_github gpt2怎么用

github gpt2怎么用

项目地址

https://github.com/yangjianxin1/GPT2-chitchat

运行项目

  1. 下载bin模型地址
    https://github.com/yangjianxin1/GPT2-chitchat#model_share
  2. 将下载的模型放在model文件夹中或者model/epoch40中
  3. 运行已经训练好的模型
python interact.py --no_cuda --model_path model_epoch40_50w (使用cpu生成,速度相对较慢)
或
python interact.py --model_path model_epoch40_50w --device 0 (指定0号GPU进行生成,速度相对较快)
  • 1
  • 2
  • 3

如何准备自己的资料

  1. 文本格式
    参照项目的数据预处理
  2. 预处理后进行tokenize
    参照项目的数据预处理
python preprocess.py --train_path data/train.txt --save_path data/train.pkl
  • 1
  1. 拿到pkl后训练模型
    参照项目的训练模型章节,就会得到bin模型
python train.py --epochs 40 --batch_size 8 --device 0,1 --train_path data/train.pkl
  • 1
本文内容由网友自发贡献,转载请注明出处:【wpsshop博客】
推荐阅读
相关标签
  

闽ICP备14008679号