赞
踩
首先,我们可以通过训练集和测试集的误差曲线来判断:
1、如果训练集精度和测试集精度都不高,则曲线符合欠拟合的表现:
(1) 数据:数据集有较多的标注错误。
(2)训练模型:可以更换模型,增加训练轮次,减小学习率或使用衰减学习率等方式进行改善。
2、如果测试集精度略低于训练集精度,则曲线符合过拟合的表现:
(1)数据:扩充数据集
(2)训练模型:可以使用droupout,L2正则化,BN,适当增大学习率或减少训练轮次等方式进行改善。
3、如果测试集精度远小于训练集精度或者训练集精度远小于测试集精度:
训练集和测试集的数据分布不一致。
4、此外,还应对数据做数据增强以使模型适应数据中不存在但实际中会存在的情况。
5、最后,进行误差分析,统计下验证集或测试集中错误样本的原因,根据不同情况再去整理数据和改善训练方案。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。