当前位置:   article > 正文

T5模型 在OCNLI 训练微调 4_t5 csc 微调loss

t5 csc 微调loss

资料

我的代码:https://github.com/Whiffe/Bert-OCNLI/tree/main/T5-OCNLI-yf

过去的内容:
Bert 在 OCNLI 训练微调
Bert 在 OCNLI 训练微调 2
BERT系列模型 在OCNLI 训练微调 3

模型下载与训练测试

mt5-base

conda install -c conda-forge sentencepiece

https://huggingface.co/google/mt5-base/tree/main
在这里插入图片描述

调用t5模型的过程:https://blog.csdn.net/znevegiveup1/article/details/121300828

训练测试结果:

train.50k.json、max_length=128、batch_size=32、dropout=0.1、lr=5e-5、epochs=10
准确率:70.13
train.50k.json、max_length=128、batch_size=32、dropout=0.3、lr=5e-5、epochs=10
准确率:70.03
train.50k.json、max_length=128、batch_size=32、dropout=0.2、lr=5e-5、epochs=10
准确率:67.43
train.50k.json、max_length=128、batch_size=32、dropout=0.1、lr=1e-5、epochs=10
准确率:58.9%
train.50k.json、max_length=128、batch_size=32、dropout=0.1、lr=5e-5、epochs=15
准确率:70.7%
train.50k.json、max_length=128、batch_size=16、dropout=0.1、lr=5e-5、epochs=15
准确率:37.63%
train.50k.json、max_length=128、batch_size=64、dropout=0.1、lr=5e-5、epochs=15
准确率:37.8%

  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15

t5-base

https://huggingface.co/google-t5/t5-base/tree/main

在这里插入图片描述
训练测试准确率

train.50k.json、max_length=128、batch_size=32、dropout=0.1、lr=5e-5、epochs=15
准确率:37.6%
  • 1
  • 2

nlp_mt5_zero-shot-augment_chinese-base

全任务零样本学习-mT5分类增强版-中文-base · 模型库 (modelscope.cn):https://www.modelscope.cn/models/iic/nlp_mt5_zero-shot-augment_chinese-base/files

在这里插入图片描述
训练测试准确率:

train.50k.json、max_length=128、batch_size=32、dropout=0.1、lr=5e-5、epochs=15
准确率:71.6%

  • 1
  • 2
  • 3

mt5-large

https://huggingface.co/google/mt5-large/tree/main
在这里插入图片描述
训练测试准确率:

在这里插入代码片
  • 1
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/在线问答5/article/detail/850529
推荐阅读
  

闽ICP备14008679号