赞
踩
1.batch_size:
喂给模型的小批次数据。
2.num_train_steps:
训练数据所需的总步数。
3.epoch:
使用训练集中的全部样本训练的总次数。
4.iteration:
iteration等于使用batch_size个样本全部跑完一次训练样本数据的次数。
5.num_warmup_steps:
学习率预热的步数。(先用最初的小学习率训练,然后每训练一步,学习率递增,直到最初设置的比较大的lr;之后学习率继续衰减。)
预热学习率的方式,即先用最初的小学习率训练,然后每个step增大一点点,直到达到最初设置的比较大的学习率时(注:此时预热学习率完成);采用最初设置的学习率进行训练(注:预热学习率完成后的训练过程,学习率是衰减的),有助于使模型收敛速度变快,效果更佳。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。