赞
踩
状态反馈控制器
通过选择K,可以改变的特征值,进而控制系统表现。
最优控制,其本质就是让系统以某种最小的代价来让系统运行,当这个代价被定义为二次泛函,且系统是线性的话,那么这个问题就称为线性二次问题,设计的控制器(即问题的解)可以称为LQR(Linear Quadratic Regulator)线性二次调节器。
代价函数
一般来说,Q阵和R阵为单位对角阵,对角阵上的元素对应着不同状态量和控制量的权重大小,越大说明我们设计时对于该量的重视程度越大,即希望这个量在变化过程中保持较小的值,换种说法就是对于该量的“惩罚”越大。积分号说明从开始控制起到最终无限时间代价函数值的累积,因为是二次的,所以代价始终大于0,最终趋于0,我们的设计目标就是得到一系列的控制序列使代价累积的最小。
具体推导过程
将代入代价函数J,有
假设存在一个常量矩阵P使得
将上式左侧微分展开
代入控制量可以整理得到
观察上面的等式,A,B,Q,R,P都是常值矩阵,唯一可变的是K阵,所以问题转换为找到一个K使得代价函数最小,一种思路是如果我们可以把含有K的部分转换成类似的结构,那么要使代价最小,只需使,那么K便可以求出。
令代入上式中,可以得到
将用待定系数法化成目标形式,可得
且
令解出
代入Riccati方程中化简后得
设计步骤
离散系统
代价函数
设计步骤
参考资料:LQR最优控制方法小结 - 知乎
【控制理论】离散及连续的LQR控制算法原理推导_CHH3213的博客-CSDN博客_lqr控制
【Advanced控制理论】8_LQR 控制器_状态空间系统Matlab/Simulink建模分析_哔哩哔哩_bilibili
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。