赞
踩
Nesterov’s Accelerated Gradient Descent
一般的梯度下降算法的收敛速率为
加速梯度算法(AGD)是梯度算法(GD)的一个改进的版本。Nesterov 在1983年首次提出。人们已经证明AGD算法是所有基于梯度算法(或者说一阶)算法中最好的方法。然而原始的AGD算法仅能处理光滑的凸优化问题。最新的进展是,将AGD扩展到了更广泛类型的凸优化问题:
AGD算法可以概括为算法1:,其中有两种方式确定步长
首先,类似于梯度下降算法,为了确保收敛率,我们可以设置
通常给定
注意:序列
AGD 是最优的基于梯度的方法。因为它提供了最优的收敛率。假定满足下面的Lipschitz 条件。
假设1. 假定平滑的凸函数
在这个假设下,如果步长选择的足够小,或者通过直线搜索确定,那么我们有下面的收敛率:
首先定义下面的序列:
换句话说:
Nesterov加速梯度下降法执行简单的梯度下降步骤,从
参考文献:
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。