赞
踩
其中动量系数一般取(0,1),直观上理解就是要是当前梯度方向与前一步的梯度方向一样,那么就增加这一步的权值更新,要是不一样就减少更新。
更详细的介绍参见《DeepLearning最优化方法之Momentum(动量)》