当前位置:   article > 正文

【轨迹规划论文整理(1)】UAV轨迹规划的开山之作Minimum Snap Trajectory_minimum snap trajectory generation and control for

minimum snap trajectory generation and control for quadrotors

轨迹规划论文整理(1)】UAV轨迹规划的开山之作Minimum Snap Trajectory Generation and Control for Quadrotors

本系列主要是对精读的一些关于无人机、无人车的轨迹搜索论文的整理,包括了论文所拓展的其他一些算法的改进思路。
这是本系列的第一篇文章,也是UAV轨迹规划的开山之作,是所有学习无人机方向的需要精读的第一篇文章,两个作者来自于宾夕法尼亚大学的GRASP Lab,是全球顶尖的机器人团队,也是UAV方向研究的开山鼻祖之一。

Mellinger D , Kumar V .Minimum snap trajectory generation and control for quadrotors[J].IEEE, 2011.DOI:10.1109/ICRA.2011.5980409.

1. Introduction

1.1 轨迹规划的定义

在机器人导航过程中,如何控制机器人从A点移动到B点,通常称之为运动规划。运动规划一般分为两步:

  • 路径搜索:在地图(包括给栅格、八叉树、点云地图等等) 搜索一条从A到B点的路径,这条路径通常是由一系列离散的空间点(waypoint)组成。该部分称之为前端。
  • 轨迹规划:由于路径点可能比较稀疏、而且不平滑,为了更好地控制机器人运动,需要将稀疏的路径点变成平滑的曲线或稠密的轨迹点,即轨迹。这部分称之为后端。

本文的主要工作就是一种无人机轨迹生成的方法,额外还包括了建模和控制器的设计。

2. Model

在这里插入图片描述

图中是本文定义的坐标关系,利用Z-X-Y欧拉角定义横滚角、俯仰角、偏航角(roll,pitch,yaw)作为本地坐标系统。从B至W的旋转矩阵通过 R B W = R C W R B C R_B^W=R_C^WR_B^C RBW=RCWRBC来表示, R C W R_C^W RCW代表偏航角旋转至中间坐标系(Z轴方向与世界坐标Z轴方向一致)。UAV机体在世界坐标系的角速度计算如下,p、q、r分量在记载坐标系中的分量为:

ω B W = p X B + q Y B + r Z B \omega_B^W=pX_B+qY_B+rZ_B ωBW=pXB+qYB+rZB

每个电机有角速度 ω i \omega_i ωi,产生一个力 F i F_i Fi M i M_i Mi,关系为:

F i = k F ω i 2 M i = k M ω i 2 F_i=k_F\omega_i^2 \\ M_i=k_M\omega_i^2 Fi=kFωi2Mi=kMωi2

控制输入记为u, u 1 u_1 u1为净升力, u 2 、 u 3 、 u 4 u_2、u_3、u_4 u2u3u4是机体力矩可以通过电机转速表示为(L是电机旋转中心到电机中心的距离)

u = [ k F k F k F k F 0 k F L 0 − k F L − k F L 0 k F L 0 k M − k M k M − k M ] [ ω 1 2 ω 2 2 ω 3 2 ω 4 2 ] \mathbf{u}=

[kFkFkFkF0kFL0kFLkFL0kFL0kMkMkMkM]
[ω12ω22ω32ω42]
u= kF0kFLkMkFkFL0kMkF0kFLkMkFkFL0kM ω12ω22ω32ω42

机体的线加速度,其中系统受力为 − z W -z_W zW方向上的重力和四个电机的合力为 z B z_B zB方向上的 u 1 u_1 u1

m r ¨ = − m g z W + u 1 z B

mr¨=mgzW+u1zB
mr¨=mgzW+u1zB

用欧拉公式计算角速度如下,其中I是惯性矩矩阵:

ω ˙ B W = I − 1 [ − ω B W × I ω B W + [ u 2 u 3 u 4 ] ] \left.\dot{\omega}_{\mathcal{BW}}=\mathcal{I}^{-1}\left[-\omega_{\mathcal{BW}}\times\mathcal{I}\omega_{\mathcal{BW}}+\left[

u2u3u4
\right.\right]\right] ω˙BW=I1 ωBW×IωBW+ u2u3u4

UAV系统的状态向量由质心的位置和速度、方向和角速度给出:

X = [ x , y , z , ϕ , θ , ψ , x ˙ , y ˙ , z ˙ , p , q , r ] X=[x,y,z,\phi,\theta,\psi,\dot{x},\dot{y},\dot{z},p,q,r] X=[x,y,z,ϕ,θ,ψ,x˙,y˙,z˙,p,q,r]

3. 微分平坦性

UAV的平坦输出可以写作:

σ = [ x , y , z , ψ ] T \sigma=[x,y,z,\psi]^T σ=[x,y,z,ψ]T

其中 r = [ x , y , z ] T r=[x,y,z]^T r=[x,y,z]T是世界坐标系中质心的坐标,而ψ是偏航角,这里定义轨迹 σ ( t ) \sigma(t) σ(t)为平坦输出空间中的平滑曲线:

σ ( t ) : [ t 0 , t m ] → R 3 × S O ( 2 ) \sigma(t):[t_0,t_m]\to\R^3\times SO(2) σ(t):[t0,tm]R3×SO(2)

根据微分平坦性,系统的状态和控制输入可以用 σ \sigma σ及其导数表示,具体推导参考博客

4. 控制

本文设计了一个控制器去跟踪特定轨迹 σ T ( t ) = [ r T ( t ) T , ψ T ( t ) ] T \sigma_T(t)=[r_T(t)^T,\psi_T(t)]^T σT(t)=[rT(t)T,ψT(t)]T。首先定义位置和速度误差为

e p = r − r T , e v = r ˙ − r ˙ T e_p=r-r_T,e_v=\dot{r}-\dot{r}_T ep=rrT,ev=r˙r˙T

计算控制器所需要的力矢量:

F d e s = − K p e p − K v e v + m g z W + m r ¨ T F_{des}=-K_pe_p-K_ve_v+mgz_W+m\ddot{r}_T Fdes=KpepKvev+mgzW+mr¨T

将所需的力矢量投影到实际的身体坐标系z轴上,从而计算第一输入的所需力:

u 1 = F d e s ⋅ z B u_1=F_{des}\cdot z_B u1=FdeszB

理想的 Z B , d e s Z_{B,des} ZB,des一定沿着理想推力方向:

Z B , d e s = F d e s ∣ ∣ F d e s ∣ ∣ Z_{B,des}=\frac{F_{des}}{||F_{des}||} ZB,des=∣∣Fdes∣∣Fdes

此时,理想的旋转 R B W R_B^W RBW为:

R d e s e 3 = Z B , d e s R_{des}e_3=Z_{B,des} Rdese3=ZB,des

其他理想状态量:

x C , d e s = [ cos ⁡ ψ T , sin ⁡ ψ T , 0 ] T , and y B , d e s = z B , d e s × x C , d e s ∥ z B , d e s × x C , d e s ∥ , x B , d e s = y B , d e s × z B , d e s , \mathbf{x}_{C,des}=\left[\cos\psi_T, \sin\psi_T, 0\right]^T,\\\text{and}\\\mathbf{y}_{B,des}=\frac{\mathbf{z}_{B,des}\times\mathbf{x}_{C,des}}{\|\mathbf{z}_{B,des}\times\mathbf{x}_{C,des}\|}, \mathbf{x}_{B,des}=\mathbf{y}_{B,des}\times\mathbf{z}_{B,des}, xC,des=[cosψT,sinψT,0]T,andyB,des=zB,des×xC,deszB,des×xC,des,xB,des=yB,des×zB,des,

Z B , X B , Y B Z_B,X_B,Y_B ZB,XB,YB构成了旋转矩阵,从而获得了理想的旋转矩阵

定义旋转误差:

e R = 1 2 ( R d e s T R B W − R B W T R d e s ) ∨ \mathbf{e}_R=\frac{1}{2}(R_{des}^T{}R_B^W-R_B^W{}^TR_{des})^\vee eR=21(RdesTRBWRBWTRdes)

角速度误差(机身系):

e ω = ω − ω T e_\omega=\omega-\omega_T eω=ωωT

另外三个输入的计算如下,两个K都是对角增益矩阵:

[ u 2 , u 3 , u 4 ] T = − K R e R − K ω e ω [u_2,u_3,u_4]^T=-K_Re_R-K_\omega e_\omega [u2,u3,u4]T=KReRKωeω

5. 轨迹生成(本文最重要部分)

生成的轨迹可以写成m个时间间隔上的n阶分段多项式函数:

σ T ( t ) = { ∑ i = 0 n σ T i 1 t i t 0 ≤ t < t 1 ∑ i = 0 n σ T i 2 t i t 1 ≤ t < t 2 ⋮ ∑ i = 0 n σ T i m t i t m − 1 ≤ t ≤ t m \sigma_T(t)=\left\{

i=0nσTi1tit0t<t1i=0nσTi2tit1t<t2i=0nσTimtitm1ttm
\right. σT(t)= i=0nσTi1tii=0nσTi2tii=0nσTimtit0t<t1t1t<t2tm1ttm

根据上一节的微分平坦性,这里的 σ T = [ x T , y T , z T , ψ T ] T \sigma_T=[x_T,y_T,z_T,\psi_T]^T σT=[xT,yT,zT,ψT]T σ i = [ x i , y i , z i , ψ i ] T \sigma_i=[x_i,y_i,z_i,\psi_i]^T σi=[xi,yi,zi,ψi]T。上述中要求相邻两段轨迹相同的时间节点是 r T r_T rT微分连续。

建立二次规划问题,c是一个4nm*1的向量,包含了 σ T i j = [ x T i j , y T i j , z T i j , ψ T i j ] T \sigma_{T_{ij}}=[x_{T_{ij}},y_{T_{ij}},z_{T_{ij}},\psi_{T_{ij}}]^T σTij=[xTij,yTij,zTij,ψTij]T及它们的导数:

min ⁡ c T H c + f T c s . t . A c ≤ b \min c^THc+f^Tc\\s.t. Ac\le b mincTHc+fTcs.t.Acb

接下来的解析我觉得文章本身不是很清晰,但是结合深蓝学院的课程和其他博客的思路,重新解读一下。

5.1 一段多项式轨迹

N+1个已知参数点可以拟合N次函数,对于首尾位置、速度、加速度已知的条件(相当于6个已知参数),可以唯一确定一个五次多项式。

5.2 多段多项式轨迹

本文提出了一个经过多个中间航迹点的轨迹,分别使用多个轨迹段进行拟合。但是相对于一段轨迹我们指定了节点的PVA,对于多段轨迹的中间点我们很难给定UAV经过这些航点的VAJ等信息,此时我们将中间速度、加速度等信息看作一个可以自由变化的状态,对于中间状态不确定的问题,可以构建一个优化问题,使得中间状态取得某一个值时,制定的代价函数达到最小值。

Minimum Snap的核心思路就是多端轨迹的中间航点的变量如何取值可以使机器人能量耗费最少。

5.3 Minimum Snap

UAV的轨迹再各个坐标轴上是独立的,因此可以对其分别进行轨迹拟合。即xyz轴上路径生成可以直接将三个轴合成就得到一个完整的空间轨迹。下面的推导均在一维上进行。

第m段轨迹表示如下:

P m ( t ) = p m , 0 t 0 + p m , 1 t 1 + ⋯ + p m , N t N = [ p m , 0 p m , 1 ⋯ p m , N ] [ t 0 t 1 ⋮ t N ] \mathrm{P_m\left(t\right)=p_{m,0}t^0+p_{m,1}t^1+\cdots+p_{m,N}t^N}\\=

[pm,0pm,1pm,N]
[t0t1tN]
Pm(t)=pm,0t0+pm,1t1++pm,NtN=[pm,0pm,1pm,N] t0t1tN

这个多项式就有N+1个未知系数。

对其分别求一阶、二阶、三阶导,获得它的速度、加速度、Jerk函数函数如下:

d P ( t ) d t = [ p m , 0 p m , 1 ⋯ p m , N ] [ 0 1 ⋮ N t N − 1 ]   d 2 P ( t ) d t 2 = [ p m , 0 p m , 1 ⋯ p m , N ] [ 0 1 ∗ 0 2 ∗ 1 ⋮ N ( N − 1 ) t N − 2 ]

dP(t)dt=[pm,0pm,1pm,N][01NtN1] d2P(t)dt2=[pm,0pm,1pm,N][01021N(N1)tN2]
dtdP(t) dt2d2P(t)=[pm,0pm,1pm,N] 01NtN1 =[pm,0pm,1pm,N] 01021N(N1)tN2

d 3 P ( t ) d t 3 = [ p m , 0 p m , 1 ⋯ p m , N ] [ 0 ∗ 0 ∗ 0 1 ∗ 0 ∗ 0 2 ∗ 1 ∗ 0 ⋮ N ( N − 1 ) ( N − 2 ) t N − 3 ] d 4 P ( t ) d t 4   =   [ p m , 0 p m , 1 ⋯ p m , N ]   [ 0 ∗ 0 ∗ 0 ∗ 0 1 ∗ 0 ∗ 0 ∗ 0 2 ∗ 1 ∗ 0 ∗ 0 3 ∗ 2 ∗ 1 ∗ 0 ⋮ N ( N − 1 ) ( N − 2 ) ( N − 3 ) t N − 4 ] \frac{\mathrm{d}^3\mathrm{P}\left(\mathrm{t}\right)}{\mathrm{d}\mathrm{t}^3}=

[pm,0pm,1pm,N]
[000100210N(N1)(N2)tN3]
\\\mathrm{\frac{d^4P(t)}{dt^4}}\:=\:
[pm,0pm,1pm,N]
\:
[0000100021003210N(N1)(N2)(N3)tN4]
dt3d3P(t)=[pm,0pm,1pm,N] 000100210N(N1)(N2)tN3 dt4d4P(t)=[pm,0pm,1pm,N] 0000100021003210N(N1)(N2)(N3)tN4

在论文中提出了一个代价函数 J m J_m Jm,对应的是一段多项式轨迹的四阶导数(snap)平方的积分,具体公式如下:

J m = ∫ T m − 1 T m ( d 4 P ( t ) d t 4 ) 2 = ∫ T m − 1 T m [ p N p N − 1 ⋮ p 0 ] T [ N ( N − 1 ) ( N − 2 ) ( N − 3 ) t N − 4 ⋮ 3 ∗ 2 ∗ 1 ∗ 0 2 ∗ 1 ∗ 0 ∗ 0 1 ∗ 0 ∗ 0 ∗ 0 0 ∗ 0 ∗ 0 ∗ 0 ] [ N ( N − 1 ) ( N − 2 ) ( N − 3 ) t N − 4 ⋮ 3 ∗ 2 ∗ 1 ∗ 0 2 ∗ 1 ∗ 0 ∗ 0 1 ∗ 0 ∗ 0 ∗ 0 0 ∗ 0 ∗ 0 ∗ 0 ] T [ p N ⋮ p N − 1 ⋮ p 0 ] = P m T Q m P m \mathrm{J_m=\int_{T_{m-1}}^{T_m}(\frac{d^4P\left(t\right)}{dt^4})^2}\\=\int_{\mathrm{T_{m-1}}}^{\mathrm{T_m}}

[pNpN1p0]
^{\mathrm{T}}
[N(N1)(N2)(N3)tN43210210010000000]
[N(N1)(N2)(N3)tN43210210010000000]
^{\mathrm{T}}
[pNpN1p0]
\\=P_m^TQ_mP_m Jm=Tm1Tm(dt4d4P(t))2=Tm1Tm pNpN1p0 T N(N1)(N2)(N3)tN43210210010000000 N(N1)(N2)(N3)tN43210210010000000 T pNpN1p0 =PmTQmPm

其中 Q m Q_m Qm如下:

[ N ( N − 1 ) ( N − 2 ) ( N − 3 ) N ( N − 1 ) ( N − 2 ) ( N − 3 ) ( T m − T m − 1 ) N + N − 7 N + N − 7 N ( N − 1 ) ( N − 2 ) ( N − 3 ) ( N − 1 ) ( N − 2 ) ( N − 3 ) ( N − 4 ) ( T m − T m − 1 ) N + N − 1 − 7 N + N − 1 − 7 ⋯ ⋮ ⋮ ⋮ ⋯ i ( i − 1 ) ( i − 2 ) ( i − 3 ) ( i − 1 ) ( i − 2 ) ( T m − T m − 1 ) i + 1 − 7 i + 1 − 7 ⋯ ⋮ ⋮ ⋮ 0 0 ⋯ ]

[N(N1)(N2)(N3)N(N1)(N2)(N3)(TmTm1)N+N7N+N7N(N1)(N2)(N3)(N1)(N2)(N3)(N4)(TmTm1)N+N17N+N17\varvdots\varvdots\varvdotsi(i1)(i2)(i3)(i1)(i2)(TmTm1)i+17i+17\varvdots\varvdots\varvdots00]
N+N7N(N1)(N2)(N3)N(N1)(N2)(N3)(TmTm1)N+N70N+N17N(N1)(N2)(N3)(N1)(N2)(N3)(N4)(TmTm1)N+N17i+17i(i1)(i2)(i3)(i1)(i2)(TmTm1)i+170

上式中 T m − T m − 1 T_m-T_{m-1} TmTm1实际就是该段轨迹运动所用的时长,为了不让每一段轨迹的时间差过大,这里采用相对时间来表示,对于每一段轨迹认为它们的时间都是 ( 0 , T m ) (0,T_m) (0,Tm)

总的代价函数

假设现在有M段轨迹,那么每段轨迹都是一个高阶的多项式函数,写出代价函数如下:

J = J 0 + J 1 + ⋯ + J M = ∑ m = 0 M P m ⃗ T Q m P m ⃗ = [ P 0 P 1 ⋮ P M ] T [ Q 0 0 ⋯ ⋯ 0 0 Q 1 0 ⋯ 0 ⋮ ⋮ ⋮ ⋯ ⋮ 0 0 0 ⋯ Q M ] [ P 0 P 1 ⋮ P M ]

J=J0+J1++JM=m=0MPmTQmPm=[P0P1PM]T[Q0000Q100000QM][P0P1PM]
J=J0+J1++JM=m=0MPm TQmPm = P0P1PM T Q0000Q100000QM P0P1PM

代价函数完成了,但是还缺少约束,即每个中间航点在前后两段轨迹的速度、加速度或者jerk是连续的,如此运动轨迹才是平滑的。

5.4 约束

连续性约束

限制中间的航迹点在两段轨迹的接合处是左右两边状态连续的,写成数学形式如下:

P m ( k ) ( T m ) = P m + 1 ( k ) ( T m ) P_m^{(k)}(T_m)=P_{m+1}^{(k)}(T_m) Pm(k)(Tm)=Pm+1(k)(Tm)

即轨迹段 P m P_m Pm P m + 1 P_{m+1} Pm+1 T m T_m Tm时刻具有相同的k阶导数。

P m ( k ) ( T m ) = P m + 1 ( k ) ( T m ) ⇒ ∑ i ≥ k i ! ( i − k ) ! T m i − k p m , i − ∑ l ≥ k l ! ( l − k ) ! T m l − k p m + 1 , l = 0 ⇒ [ A m − A m + 1 ] [ P m P m + 1 ] = 0

Pm(k)(Tm)=Pm+1(k)(Tm)iki!(ik)!Tmikpm,ilkl!(lk)!Tmlkpm+1,l=0[AmAm+1][PmPm+1]=0
Pm(k)(Tm)=Pm+1(k)(Tm)ik(ik)!i!Tmikpm,ilk(lk)!l!Tmlkpm+1,l=0[AmAm+1][PmPm+1]=0

微分约束

启动和终点的PVA使用确定值限制,即 P 0 ( 0 ) , P 0 ( 1 ) ( 0 ) , P 0 ( 2 ) ( 0 ) , P M ( T M ) , P M ( 1 ) ( T M ) , P M ( 2 ) ( T M ) P_0(0),P_0^{(1)}(0),P_0^{(2)}(0),P_M(T_M),P_M^{(1)}(T_M),P_M^{(2)}(T_M) P0(0),P0(1)(0),P0(2)(0),PM(TM),PM(1)(TM),PM(2)(TM)已知。

中间航迹点的位置确定,即 P m ( 0 ) 和 P M ( T m ) P_{m}(0)和P_{M}(T_m) Pm(0)PM(Tm)已知。

融合上述的约束得到:

[ A 0 0 0 0 ⋯ 0 A 0 − A 1 0 0 ⋯ 0 0 A 1 0 0 ⋯ 0 0 A 1 − A 2 0 ⋯ 0 ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ 0 0 0 0 0 A M ] [ P 0 P 1 P 2 P 3 ⋮ P M ] = [ d 0 0 d 1 0 ⋮ d M ]

[A00000A0A10000A10000A1A20000000AM]
[P0P1P2P3PM]
=
[d00d10dM]
A0A00000A1A1A10000A200000000000AM P0P1P2P3PM = d00d10dM

到此,整个QP问题构建完毕。

5.5 求解QP

多项式轨迹中的系数 p p p没有具体的物理意义,通过无约束方程求解的p可能会出现一些特别小的值,受计算精度影响,导致数值不稳定。

Polynomial Trajectory Planning for Aggressive Quadrotor Flight in Dense Indoor Environments, Charles Richter, Adam Bry, and Nicholas Roy.

为了解决这个系数不稳定的问题,在上文中提出了将系数通过一个映射矩阵转换成轨迹端点的导数,也就是说我们不再优化轨迹的系数,而是对轨迹在端点处的位置、速度、加速度、Jerk等进行优化,由于这些量都是有实际物理含义,不会出现太离谱的数值,所以在一定程度上是比较稳定的。

以最小化Jerk为例,此时是多项式是一个5次多项式轨迹,那么它有6个未知的系数,需要提供轨迹两端的位置、速度、加速度约束,对轨迹进行过次求导:

[ P m ( t ) P m ( 1 ) ( t ) P m ( 2 ) ( t ) ] = [ p m , 5 t 5 p m , 4 t 4 p m , 3 t 3 p m , 2 t 2 p m , 1 t 1 p m , 0 t 0 5 p m , 5 t 4 4 p m , 4 t 3 3 p m , 3 t 2 2 p m , 2 t 1 p m , 1 t 0 0 5 ∗ 4 p m , 5 t 3 4 ∗ 3 p m , 4 t 2 3 ∗ 2 p m , 3 t 1 2 ∗ 1 p m , 2 t 0 0 0 ] = [ t 5 t 4 t 3 t 2 t 1 t 0 5 t 4 4 t 3 3 t 2 2 t 1 t 0 0 5 ∗ 4 t 3 4 ∗ 3 t 2 3 ∗ 2 t 1 2 ∗ 1 t 0 0 0 ] [ p m , 5 p m , 4 p m , 3 p m , 2 p m , 1 p m , 0 ]

[Pm(t)Pm(1)(t)Pm(2)(t)]=[pm,5t5pm,4t4pm,3t3pm,2t2pm,1t1pm,0t05pm,5t44pm,4t33pm,3t22pm,2t1pm,1t0054pm,5t343pm,4t232pm,3t121pm,2t000]=[t5t4t3t2t1t05t44t33t22t1t0054t343t232t121t000][pm,5pm,4pm,3pm,2pm,1pm,0]
Pm(t)Pm(1)(t)Pm(2)(t) = pm,5t55pm,5t454pm,5t3pm,4t44pm,4t343pm,4t2pm,3t33pm,3t232pm,3t1pm,2t22pm,2t121pm,2t0pm,1t1pm,1t00pm,0t000 = t55t454t3t44t343t2t33t232t1t22t121t0t1t00t000 pm,5pm,4pm,3pm,2pm,1pm,0

带入两端的时间,得到多项式系数到运动微分的映射关系:

[ P ( 0 ) P ( 1 ) ( 0 ) P ( 2 ) ( 0 ) P ( T ) P ( 1 ) ( T ) P ( 2 ) ( T ) ] = [ 0 5 0 4 0 3 0 2 0 1 0 0 5 ∗ 0 4 4 ∗ 0 3 3 ∗ 0 2 2 ∗ 0 1 0 0 0 5 ∗ 4 ∗ 0 3 4 ∗ 3 ∗ 0 2 3 ∗ 2 ∗ 0 1 2 ∗ 1 ∗ 0 0 0 0 T 5 T 4 T 3 T 2 T 1 T 0 5 ∗ T 4 4 ∗ T 3 3 ∗ T 2 2 ∗ T 1 T 0 0 5 ∗ 4 ∗ T 3 4 ∗ 3 ∗ T 2 3 ∗ 2 ∗ T 1 2 ∗ 1 ∗ T 0 0 0 ] [ p 5 p 4 p 3 p 2 p 1 p 0 ] ⇒ d m = A m P m ⇒ P m = A m − 1 d m

[P(0)P(1)(0)P(2)(0)P(T)P(1)(T)P(2)(T)]=[050403020100504403302201000540343023201210000T5T4T3T2T1T05T44T33T22T1T0054T343T232T121T000][p5p4p3p2p1p0]dm=AmPmPm=Am1dm
P(0)P(1)(0)P(2)(0)P(T)P(1)(T)P(2)(T) = 055045403T55T454T3044034302T44T343T2033023201T33T232T1022012100T22T121T001000T1T000000T000 p5p4p3p2p1p0 dm=AmPmPm=Am1dm

得到映射矩阵:

A m = [ 0 N 0 N − 1 ⋯ 0 2 0 1 0 0 N ∗ 0 N − 1 ( N − 1 ) ∗ 0 N − 2 ⋯ 2 ∗ 0 1 0 0 0 N ( N − 1 ) ∗ 0 N − 2 ( N − 1 ) ( N − 2 ) ∗ 0 N − 3 ⋯ 2 ∗ 1 ∗ 0 0 0 0 ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ T N T N − 1 ⋯ T 2 T 1 T 0 N ∗ T N − 1 ( N − 1 ) ∗ T N − 2 ⋯ 2 ∗ T 1 T 0 0 N ( N − 1 ) ∗ T N − 2 ( N − 1 ) ( N − 2 ) ∗ T N − 3 ⋯ 2 ∗ 1 ∗ T 0 0 0 ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ] \mathrm{A_m=

[0N0N1020100N0N1(N1)0N2201000N(N1)0N2(N1)(N2)0N3210000TNTN1T2T1T0NTN1(N1)TN22T1T00N(N1)TN2(N1)(N2)TN321T000]
} Am= 0NN0N1N(N1)0N2TNNTN1N(N1)TN20N1(N1)0N2(N1)(N2)0N3TN1(N1)TN2(N1)(N2)TN3022012100T22T121T001000T1T000000T000

将代价函数中的系数向量通过映射矩阵 A m A_m Am进行替换,得到下式:

min ⁡ [ P 0 P 1 ⋮ P M ] T [ Q 0 0 ⋯ ⋯ ⋯ 0 0 Q 1 0 ⋯ 0 ⋮ ⋮ ⋮ ⋱ ⋮ 0 0 0 ⋯ Q M ] [ P 0 P 1 ⋮ P M ] min ⁡ [ d 1 d 1 ⋮ d M ] T [ A 0 0 ⋯ ⋯ 0 0 A 1 0 ⋯ 0 ⋮ ⋮ ⋮ ⋱ ⋮ 0 0 ⋯ A M ] T [ Q 0 0 ⋯ ⋯ 0 0 Q 1 0 ⋯ 0 ⋮ ⋮ ⋮ ⋱ ⋮ 0 0 0 ⋯ Q M ] [ A 0 0 ⋯ ⋯ 0 0 A 1 0 ⋯ 0 ⋮ ⋮ ⋮ ⋱ ⋮ 0 0 0 ⋯ A M ] − 1 [ P 0 P 1 ⋮ P M ] ⇒ min ⁡ d T A − T Q A − 1 d \min\left[

P0P1PM
\right]^{\mathrm{T}}
[Q0000Q100000QM]
[P0P1PM]
\\\min\left[
d1d1dM
\right]^{\mathrm{T}}
[A0000A10000AM]
^{\mathrm{T}}
[Q0000Q100000QM]
[A0000A100000AM]
^{-1}
[P0P1PM]
\\\Rightarrow\min\mathrm{d^{T}A^{-T}QA^{-1}d} min P0P1PM T Q0000Q10000QM0 P0P1PM min d1d1dM T A0000A100AM00 T Q0000Q100000QM A0000A100000AM 1 P0P1PM mindTATQA1d

如此一来,微分约束已经融入到了PQ问题当中,但是连续性约束还没有引入到代价函数当中。

本文中引入了一个permutation Matrix(置换矩阵)C来将连续性约束引入到代价函数当中。C矩阵本身是一个只包含0和1的矩阵,它的作用是将向量 [ d 0 , d 1 , . . . , d M ] [d_0,d_1,...,d_M] [d0,d1,...,dM]进行一个组合,将固定的变量放在头部,将需要优化的变量放在尾部,并且对于连续性约束的变量值相等,因此只选择其中一个来表达连续性变量。

换言之,首尾状态和中间点航点是已知的设为 d m F d_{mF} dmF,中间点除位置信息外其他状态是代价函数再优化时需要分配的最优值,即需要优化的变量设为 d m P d_{mP} dmP

将置换矩阵带入到代价函数当中:

J = min ⁡ [ d F d P ] T C A − T Q A − 1 C T [ d F d P ] \mathrm{J}=\min

[dFdP]
^{\mathrm{T}}\mathrm{C}\mathrm{A}^{{-\mathrm{T}}}\mathrm{Q}\mathrm{A}^{-1}\mathrm{C}^{\mathrm{T}}
[dFdP]
J=min[dFdP]TCATQA1CT[dFdP]

R = C A − T Q A − 1 C T R=CA^{-T}QA^{-1}C^T R=CATQA1CT。对R矩阵根据 d F d_F dF d P d_P dP的尺寸进行分块,得到如下变换:

J = min ⁡ [ d F d P ] T C A − T Q A − 1 C T [ d F d P ] = J = min ⁡ [ d F d P ] T R [ d F d P ] = min ⁡ [ d F d P ] T [ R F F R F P R P F R P P ] [ d F d P ] = d F T R F F   d F   + d F T R F P   d P   + d P T R P F   d F   + d P T R P P   d P

J=min[dFdP]TCATQA1CT[dFdP]=J=min[dFdP]TR[dFdP]=min[dFdP]T[RFFRFPRPFRPP][dFdP]=dFTRFF dF +dFTRFP dP +dPTRPF dF +dPTRPP dP
J=min[dFdP]TCATQA1CT[dFdP]=J=min[dFdP]TR[dFdP]=min[dFdP]T[RFFRPFRFPRPP][dFdP]=dFTRFF dF +dFTRFP dP +dPTRPF dF +dPTRPP dP

对于上式J是一个标量,并且Q矩阵是对称阵,所以R矩阵也是对称阵,则 R P F = R F P T R_{PF}=R_{FP}^T RPF=RFPT。对于上式我们要求的变量是 d p d_p dp,对其求导得到

∂ J ∂ d P = 2 d F T R F P + 2 R P P   d P = 0 ⇒ d P ∗ = − R P P − 1 R F P T   d F

JdP=2dFTRFP+2RPP dP=0dP=RPP1RFPT dF
dPJ=2dFTRFP+2RPP dP=0dP=RPP1RFPT dF

然后反求得到多项式系数:

P   = A − 1 C T   [ d F d P ∗ ] \mathrm{P~=A^{-1}C^T~

[dFdP]
} P =A1CT [dFdP]

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/知新_RL/article/detail/925608
推荐阅读
相关标签
  

闽ICP备14008679号