当前位置:   article > 正文

约束优化算法

约束优化算法

下面内容是根据自己看书,对拉格朗日乘子法、罚函数法、增广拉格朗日乘子法做一个小结:

一、“拉格朗日乘子法和罚函数法都用于将有约束的优化问题转化为无约束的优化问题”


  • 比如最小化目标函数 f(x) ,约束等式为  Ax-b=0  ,这里的xn维向量,Am*n矩阵,,那么使用拉格朗日乘子将约束条件合并到目标函数中,得到拉格朗日函数:L(x,\lambda)=f(x)+{\lambda}'(Ax-b)
  • 对变量和拉格朗日乘子的更新遵循这两个式子:xk+1=argminxL(x,λk);    \lambda_{k+1}=\lambda_{k}+\mu_{k}(Ax_{k+1}-b),这里的\mu_k是步长
  • 这里涉及到对偶方面的相关知识,我在这里的知识比较欠缺,所以就只是说明一下拉格朗日乘子法是这么个东西,后面再加一篇博客讲清楚点。

  • 罚函数添加的项跟拉格朗日乘子法不同。但顾名思义,就是对约束条件之外的点进行惩罚,或者说进行最小化处理
  • 罚函数可以有两种添加方式:加法罚函数,即直接把惩罚项p(x)与目标函数相加;另一种是乘法罚函数,将惩罚项和目标函数相乘,通常加法罚函数的使用更多,个人感觉应该是为了后面的求解更加方便,而且加法罚函数在目标函数中会先乘以惩罚系数\rho再加上目标函数,也就是f(x)+ρp(x),用来选择一个适当的权重,也可以认为是标志惩罚的分量,所以一般取值是大于0的
  • p(x)内部是怎么设置的,下面分成等式和不等式约束两种进行说明

在等式约束中,对于约束条件为f(x)=0,罚函数取p(x)=f2(x)。即满足等式时该项为0,不满足该项时取平方加到目标函数中对它做最小化处理;

在不等式约束f(x)0中有两种形式,内罚p(x)=1f(x)或者p(x)=log(f(x))f(x),而外罚是p(x)=(max{0,f(x)})r;

有三个点要注意:1、内罚法由于f(x)位于分母,所以得到的解并不满足等于0的情况,阻挡了可行集边界的点,而外罚法没有这一缺点;2、外罚法可以用可行集外的点做为初始点,所以要经过比较大量的迭代才能收敛到可行集中,所以收敛慢,而内罚法要求初始点是可行集中的点,所以收敛相对较快;3、通常适用外罚法,因为内罚法的初始点搜索是件很难的事情。


缺点(书里说的,我自己也不是特别理解)

拉格朗日乘子法的两个缺点:1、当约束优化问题有局部凸结构时,对偶的无约束优化问题才是良好定义,拉格朗日乘子的更新才是合理的;2、拉格朗日目标函数收敛比较耗时,因为乘子的迭代式上升迭代。

罚函数法的两个缺点:1、收敛慢,这个应该是跟内罚法的初始点可以选择为可行集外的点有关系,一般都会做随机初始,所以选到可行集外的点就会收敛慢;2、惩罚系数太大会使得无约束优化问题产生病态,造成算法不稳定。

 

二、“增广拉格朗日乘子法”

增广拉格朗日乘子法把上面两种方法结合到一起。下面介绍下等式和不等式约束的增广拉格朗日乘子法


等式约束:比如等式约束为h(x)=Ax-b,罚函数取\frac{1}{2}\|Ax-b\|^2_2,那么增广拉格朗日函数为

L_{\rho}(x,\lambda)=f(x)+{\lambda}^T(Ax-b)+\frac{\rho}{2}\|Ax-b\|^2_2,而更新的式子如下:

xk+1=argminxLρ(x,λk);  \lambda_{k+1}=\lambda_{k}+\rho_{k}(Ax_{k+1}-b),注意这里更新乘子跟前面标准的拉格朗日乘子法不同,步长变成惩罚系数。


不等式约束:在上面等式约束基础上,添加一不等式约束Bx\preceq h(我不太理解这里为啥用的是这个符号,跟小于等于有什么区别吗,如果你知道麻烦给我留言哦,万分感谢),这时采取的做法是将不等式变成等式,添加松弛变量s,使得Bx+s=h,并构造出如下的拉格朗日目标函数:

L_{\rho}(x,s,\lambda,v)=f(x)+\lambda^T(Ax-b)+v^T(Bx+s-h)+\frac{\rho}{2}(\|Ax-b\|^2_2+\|Bx+s-h\|^2_2),而且\lambda\succeq 0,v\succeq0,\rho>0

更新式子如下所示:

xk+1=argminxLρ(x,sk,λk,vk);  sk+1=argmins0Lρ(xk+1,s,λk,vk);

\lambda_{k+1}=\lambda_{k}+\rho_{k}(Ax_{k+1}-b);  v_{k+1}=v_{k}+\rho_{k}(Bx_{k+1}+s_{k+1}-h)


这里有几个问题要注意:

1、增广拉格朗日乘子法不再需要惩罚因子ρk增加至无穷大, 只要更新拉格朗日乘子就可以收敛了。所以前面说的罚函数法的病态条件应该指的是要把惩罚因子增加至无穷大才会收敛。

2、增广拉格朗日乘子法的乘子比普通的拉格朗日乘子法要收敛得更快,而且不再像标准拉格朗日乘子法要求有局部凸结构,也就是说应用范围更广。另外,标准的拉格朗日乘子法的xL(x,\lambda_k)更新的结果,而增广的是L_{\rho}(x,\lambda_k)更新的结果,差别在于有没有惩罚项。

三、“交替方向乘子法和增广拉格朗日乘子法的关系”

交替方向乘子法是为了适应大尺度的等式约束问题,即xRn的维数很高。但是变量可以分成很多个子变量x=(x1,x2,...,xr),同时目标函数可以根据这些子变量做一个分解:f(x)=i=1rfi(xi),这时候就变成一个分布式优化的问题。而且既然变量可以分解,那么等式约束就变成Ax=i=1rAixi,所以可以得到如下的增广拉格朗日目标函数:

L_{\rho}(x,\lambda)=\sum_{i=1}^{r}L_i(x_i,\lambda)=\sum_{i=1}^{r}(f_i(x_i)+\lambda^TA_ix_i)-\lambda^Tb+\frac{\rho}{2}\|\sum_{i=1}^{r}(A_ix_i)-b\|^2_2,然后利用下面的式子做更新:

xik+1=argminxiLi(xi,λk),i=1,...,r

\lambda_{k+1}=\lambda_k+\rho_k(\sum^r_{i=1}A_ix^{k+1}_i-b)

 

以上是我看完这部分的一个小结,但理解上差了很多,只能有大概一个轮廓,如果读者有更好更容易理解的中文或者英文文献资料,麻烦给我留言,或者一起讨论学习,谢谢!!!

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/我家自动化/article/detail/929735
推荐阅读
相关标签
  

闽ICP备14008679号