赞
踩
最近在用caffe训练自己的SSD模型,结果发现loss会跳到一个几乎为0的数字,然后又会跳出来,之后一直出现周期性的现象,如图:
找了很多的原因,没在网上找到相同的问题,倒是有人提到产生数据集要采用shuffle参数,我自己也知道这个参数,但是没太在意。最终发现在生成数据集的时候,只要加上shuffle参数就可以了。
后来自己也思考了一下原因,可能是没有shuffle的情况下,连续几个batchsize内的数据高度的相似,导致训练梯度过小产生的问题。通过计算,发现一个epoch的周期刚好为880,跟loss表现出来的周期一致,更加确认了这个猜想。现在终于正常了。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。