赞
踩
RMSprop(均方根传递) 是指数滑动平均(exponentially weighted average)的改编,用于降低梯度下降和小批量梯度下降中的振荡,加速机器学习训练,即下图绿色的线。
这里的
S
d
w
S_{dw}
Sdw 值得是
d
w
2
dw^{2}
dw2 ,这种训练方法更新的是方差,虽然走的很平稳,但是还不如下面介绍的 Adam 算法好。
Adam 算法把 RMSprop 和 momentum 结合起来了。
随着训练进程,调整 learning rate 逐渐变小。
下面介绍最简单的 learning rate decay:
还有别的 decay 方法:
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。