赞
踩
最近在学习 efficienet 使用了 RMSProp 优化器,但是在 keras 使用的时候发现了问题
keras.optimizers.RMSprop(lr=0.001, rho=0.9, epsilon=None, decay=0.0)
RMSprop的初始化中有rho与decay两个参数,但是这两个参数都是衰减因子,那他们之间的区别在哪里呢,官方链接也没有详细解释,
后来在看到一篇回答时才突然了解
可以看到rho就是图中的B参数,B参数是本身就在RMSProp中的衰减因子,而作为decay,它的作用原理是在每个epoch之后对learning rate固定衰减,与算法本身无光,所以在Adam与SGD这些其他的优化器中的原理是相同中
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。