当前位置:   article > 正文

【矩阵论】Chapter 7—Hermite矩阵与正定矩阵知识点总结复习_hermite正定矩阵

hermite正定矩阵

1 Hermite矩阵

  • 定义

    A A A n n n阶方阵,如果称 A A A为Hermite矩阵,则需满足 A H = A A^H=A AH=A,其中 A H A^H AH表示 A A A的共轭转置,也称Hermite转置,具体操作如下:

    1. 将矩阵的每个元素取共轭。对于复数 a + b i a+bi a+bi,它的共轭是 a − b i a-bi abi,其中 a a a b b b 是实部和虚部
    2. 将矩阵的行和列互换

    Hermite矩阵与实对称矩阵的性质和证明方法都十分相似

  • Hermite矩阵性质

    A , B A,B A,B n n n阶Hermite矩阵,则

    1. A A A的所有特征值全是实数
    2. A A A的不同特征值所对应的特征向量是相互正交的
    3. 对正整数 k k k A k A^k Ak也是Hermite矩阵
    4. A A A可逆,则 A − 1 A^{-1} A1也是Hermite矩阵
    5. 对实数 k , p , k A + p B k,p,kA+pB k,p,kA+pB也是Hermite矩阵
  • Hermite矩阵充分必要条件

    A ∈ C n × n , B ∈ C n × n A\in C^{n\times n},B\in C^{n\times n} ACn×n,BCn×n

    1. A A A是Hermite矩阵的充要条件是存在酉矩阵 U U U使得
      U H A U = Λ = d i a g ( λ 1 , . . . , λ n ) U^HAU=\Lambda =diag(\lambda_1,...,\lambda_n) UHAU=Λ=diag(λ1,...,λn)
      其中 λ 1 , . . . , λ n \lambda_1,...,\lambda_n λ1,...,λn均为实数。实对称矩阵则是存在正交矩阵 U . . . U... U...

    2. A是Hermite矩阵的充要条件是对任意方阵 S S S S H A S S^HAS SHAS是Hermite矩阵

    3. 如果 A , B A,B A,B是Hermite阵,则 A B AB AB是Hermite矩阵的充要条件是 A B = B A AB=BA AB=BA

  • 相合标准形

    A A A n n n阶Hermite矩阵,则 A A A相合矩阵
    D 0 = ( I s 0 0 0 − I r − s 0 0 0 O n − r ) D_0=(Is000Irs000Onr)

    D0= Is000Irs000Onr
    其中 r = r a n k ( A ) r=rank(A) r=rank(A) s s s A A A的正特征值(重特征值按重数计算)的个数。矩阵 D 0 D_0 D0则称为 n n n阶Hermite矩阵 A A A的相合标准形。

  • Sylvester惯性定律

    A , B A,B A,B n n n阶Hermite矩阵,则 A A A B B B相合的充要条件是
    I n ( A ) = I n ( B ) In(A)=In(B) In(A)=In(B)
    其中 I n ( A ) In(A) In(A)称为 A A A的惯性, I n ( A ) = { π ( A ) , v ( A ) , δ ( A ) } In(A)=\{\pi(A),v(A),\delta(A)\} In(A)={π(A),v(A),δ(A)}。其中 π ( A ) \pi(A) π(A), v ( A ) v(A) v(A), δ ( A ) \delta(A) δ(A)分别表示 A A A的正、负和零特征值的个数(重特征值按重数计算)。则 A A A非奇异的充要条件为 δ ( A ) = 0 \delta(A)=0 δ(A)=0 π ( A ) + v ( A ) = r a n k ( A ) \pi(A)+v(A)=rank(A) π(A)+v(A)=rank(A)

2 Hermite二次型

  • Hermite二次型定义

    n n n个复变量 x 1 , . . . , x n x_1,...,x_n x1,...,xn,系数为负数的二次齐式
    f ( x 1 , . . . , x n ) = ∑ i = 1 n ∑ j = 1 n a i j x i ˉ x j ˉ f(x_1,...,x_n)=\sum_{i=1}^{n}\sum_{j=1}^{n}a_{ij}\bar{x_i}\bar{x_j} f(x1,...,xn)=i=1nj=1naijxiˉxjˉ
    其中 a i j = a j i a_{ij}=a_{ji} aij=aji,称为Hermite二次型。Hermite二次型可写为 f ( x ) = x H A x f(x)=x^HAx f(x)=xHAx,我们称 A A A的秩就为Hermite二次型的秩。

  • Hermite二次型的标准形定理

    对Hermite二次型 f ( x ) = x H A x f(x)=x^HAx f(x)=xHAx,存在酉线性变换 x = U y x=Uy x=Uy(其中 U U U是酉矩阵)使得Hermite二次型 f ( x ) f(x) f(x)变成标准形(只包含平方项的二次型)
    f ( x ) = λ 1 y 1 ˉ y 1 + . . . + λ n y n ˉ y n f(x)=\lambda_1\bar{y_1}y_1+...+\lambda_n\bar{y_n}y_n f(x)=λ1y1ˉy1+...+λnynˉyn
    其中 λ 1 , . . . , λ n \lambda_1,...,\lambda_n λ1,...,λn A A A的特征值。

  • Hermite二次型化标准形(酉线性变换)

    f ( x ) = x H A x f(x)=x^HAx f(x)=xHAx,其中 A A A n n n阶Hermite矩阵

    1. 求出二次型矩阵 A A A的特征值 λ 1 , . . . λ n \lambda_1,...\lambda_n λ1,...λn和特征向量 v 1 , . . . , v n v_1,...,v_n v1,...,vn,并将特征向量 v 1 , . . . , v n v_1,...,v_n v1,...,vn规范正交

    2. U = ( v 1 , . . . , v n ) , x = U y U=(v_1,...,v_n),x=Uy U=(v1,...,vn),x=Uy,则
      f ( x ) = ( U y ) H A ( U y ) = y H U H A U y = y H ( U H A U ) y = y H Λ y = λ 1 ∣ y 1 ∣ 2 + . . . + λ n ∣ y n ∣ 2 f(x)=(Uy)^HA(Uy)=y^HU^HAUy=y^H(U^HAU)y\\=y^H\Lambda y=\lambda_1|y_1|^2+...+\lambda_n|y_n|^2 f(x)=(Uy)HA(Uy)=yHUHAUy=yH(UHAU)y=yHΛy=λ1y12+...+λnyn2

  • Hermite二次型规范形定理

    对二次型 f ( x ) = x H A x f(x)=x^HAx f(x)=xHAx,存在可逆线性变换 x = P y x=Py x=Py使得Hermite二次型 f ( x ) f(x) f(x)化为
    f ( x ) = y 1 ˉ y 1 + . . . + y s ˉ y s − y s + 1 ˉ y s + 1 − . . . − y r ˉ y r f(x)=\bar{y_1}y_1+...+\bar{y_s}y_s-\bar{y_{s+1}}y_{s+1}-...-\bar{y_r}y_r f(x)=y1ˉy1+...+ysˉysys+1ˉys+1...yrˉyr
    其中 r = r a n k ( A ) , s = π ( A ) r=rank(A),s=\pi(A) r=rank(A),s=π(A)。上式则为Hermite二次型 f ( x ) f(x) f(x)的规范形,其中 s s s ( r − s ) (r-s) (rs)分别称为Hermite二次型的正惯性指数和负惯性指数。

  • 二次型化规范形

    f ( x ) = x H A x f(x)=x^HAx f(x)=xHAx,其中 A A A n n n阶Hermite矩阵

    1. 将二次型化为标准形,得到标准形 f ( x ) = y H Λ y f(x)=y^H\Lambda y f(x)=yHΛy和酉矩阵 U U U

    2. 将对角线元素提取出来,即只保留 λ i \lambda_i λi的正负性,则
      f ( x ) = y H Λ y = y H ( Λ 1 D 0 Λ 1 ) y = y H ( Λ 1 H D 0 Λ 1 ) y = ( Λ 1 y ) H D 0 ( Λ 1 y ) f(x)=y^H\Lambda y=y^H(\Lambda_1 D_0 \Lambda_1)y=y^H(\Lambda_1^HD_0\Lambda_1)y\\ =(\Lambda_1y)^HD_0(\Lambda_1y) f(x)=yHΛy=yH(Λ1D0Λ1)y=yH(Λ1HD0Λ1)y=(Λ1y)HD0(Λ1y)
      其中 Λ 1 \Lambda_1 Λ1为对角矩阵,对角线元素为 ∣ λ i ∣ ( 1 ≤ i ≤ n ) \sqrt {|\lambda_i}|(1\leq i \leq n) λi (1in)

    3. y = Λ 1 − 1 z y=\Lambda_1^{-1} z y=Λ11z,则
      f ( x ) = ( Λ 1 Λ 1 − 1 z ) H D 0 ( Λ 1 Λ 1 − 1 z ) = z H D 0 z = z 1 ˉ z 1 + . . . + z s ˉ y s − z s + 1 ˉ z s + 1 − . . . − z r ˉ z r f(x)=(\Lambda_1\Lambda_1^{-1}z)^HD_0(\Lambda_1\Lambda_1^{-1}z)=z^HD_0z\\=\bar{z_1}z_1+...+\bar{z_s}y_s-\bar{z_{s+1}}z_{s+1}-...-\bar{z_r}z_r f(x)=(Λ1Λ11z)HD0(Λ1Λ11z)=zHD0z=z1ˉz1+...+zsˉyszs+1ˉzs+1...zrˉzr

    4. x = U Λ − 1 z x=U\Lambda^{-1}z x=UΛ1z,可逆矩阵 P = U Λ − 1 P=U\Lambda^{-1} P=UΛ1

  • 正定相关概念

    f ( x ) = x H A x f(x)=x^HAx f(x)=xHAx为Hermite二次型

    1. 如果 f ( x ) > 0 f(x)>0 f(x)>0(等价 s = r = n s=r=n s=r=n),则称 f ( x ) f(x) f(x)为正定的;
    2. 如果 f ( x ) ≥ 0 f(x)\geq0 f(x)0(等价 s = r < n s=r<n s=r<n),则称 f ( x ) f(x) f(x)为半正定(非负定的)的;
    3. 如果 f ( x ) < 0 f(x)<0 f(x)<0(等价 s = 0 , r = n s=0,r=n s=0,r=n),则称 f ( x ) f(x) f(x)为负定的;
    4. 如果 f ( x ) ≤ 0 f(x)\leq0 f(x)0(等价 s = 0 , r < n s=0,r<n s=0,r<n),则称 f ( x ) f(x) f(x)为半负定的;
    5. 如果 f ( x ) f(x) f(x)有时为正有时为负(等价 0 < s < r ≤ n 0<s<r\leq n 0<s<rn),则称 f ( x ) f(x) f(x)为不定的;

3 Hermite正定(非负定矩阵)

  • 定义

    根据Hermite二次型的正定(非负定)可以定义Hermite矩阵的正定(非负定)。

    A A A n n n阶Hermite矩阵, f ( x ) = x H A x f(x)=x^HAx f(x)=xHAx

    1. 如果 f ( x ) > 0 f(x)>0 f(x)>0,则称 A A A为正定的,记作 A > 0 A>0 A>0
    2. 如果 f ( x ) ≥ 0 f(x)\geq0 f(x)0,则称 A A A为半正定(非负定的)的,记作 A ≥ 0 A\geq 0 A0
    3. 如果 f ( x ) < 0 f(x)<0 f(x)<0,则称 A A A为负定的,记作 A < 0 A<0 A<0
    4. 如果 f ( x ) ≤ 0 f(x)\leq0 f(x)0,则称 A A A为半负定的,记作 A ≤ 0 A\leq 0 A0
    5. 如果 f ( x ) f(x) f(x)有时为正有时为负,则称 A A A为不定的;
  • 判断 n n n阶Hermite矩阵 A A A正定

    1. 通过正定矩阵的定义
    2. A A A n n n个特征值均为正数
    3. A A A的顺序主子式 Δ k = A ( 1 … k 1 … k ) > 0 , ( k = 1 , . . . , n ) \Delta_k=A(1k1k)
      >0,(k=1,...,n)
      Δk=A(11kk)>0,(k=1,...,n)
      均为正数
    4. A A A的所有主子式全大于 0 0 0
    5. 存在 n n n阶非奇异下三角矩阵 L L L,使得 A = L L H A=LL^H A=LLH(该分解称为Cholesky分解)
    6. 存在 n n n阶非奇异矩阵,使得 A = B H B A=B^HB A=BHB
    7. 存在 n n n阶非奇异Hermite矩阵 A = S 2 A=S^2 A=S2
  • 判断 n n n阶Hermite矩阵 A A A半正定

    1. 通过半正定矩阵的定义
    2. A A A n n n个特征值均为非负数
    3. A A A的所有主子式均非负
  • 定理证明

    A , B A,B A,B均为 n n n阶Hermite矩阵,且 B > 0 B>0 B>0,则存在非奇异矩阵 P P P使得
    P H A P = d i a g ( λ 1 , . . . , λ n ) , P H B P = I P^HAP=diag(\lambda_1,...,\lambda_n),P^HBP=I PHAP=diag(λ1,...,λn),PHBP=I
    其中 λ 1 , . . . , λ n \lambda_1,...,\lambda_n λ1,...,λn是广义特征值问题的特征值

    证明:

    ∵ B > 0 \because B >0 B>0

    $\therefore 存在非奇异矩阵 存在非奇异矩阵 存在非奇异矩阵P_1 使得 使得 使得P_1^HBP_1=I$

    ∵ P 1 H A P 1 \because P_1^HAP_1 P1HAP1仍为Hermite矩阵

    ∴ \therefore 酉矩阵 U U U使得
    U H ( P 1 H A P 1 ) U = d i a g ( λ 1 , . . . , λ n ) U^H(P_1^HAP_1)U=diag(\lambda_1,...,\lambda_n) UH(P1HAP1)U=diag(λ1,...,λn)
    P = P 1 U P=P_1U P=P1U

    ∵ P \because P P非奇异,根据定理 P H B P = I P^HBP=I PHBP=I

    ∴ P H B P = ( P 1 U ) H B ( P 1 U ) = U H P 1 H B P 1 U = I \therefore P^HBP=(P_1U)^HB(P_1U)\\=U^HP_1^HBP_1U=I PHBP=(P1U)HB(P1U)=UHP1HBP1U=I

    ∵ P 1 \because P_1 P1非奇异,使得 P 1 H B P 1 = I P_1^HBP_1=I P1HBP1=I

    ∴ \therefore
    P H B P = U H P 1 H B P 1 U = U H ( P 1 H B P 1 ) U = U H I U = U H U = I P^HBP= U^HP_1^HBP_1U=U^H(P_1^HBP_1)U\\=U^HIU=U^HU=I PHBP=UHP1HBP1U=UH(P1HBP1)U=UHIU=UHU=I
    ∴ \therefore
    P H A P = U H P 1 H A P 1 U = d i a g ( λ 1 , . . . , λ n ) P^HAP=U^HP_1^HAP_1U=diag(\lambda_1,...,\lambda_n) PHAP=UHP1HAP1U=diag(λ1,...,λn)
    ∴ \therefore 我们可以对上式右乘 P − 1 P^{-1} P1 B − 1 B^{-1} B1,得到
    P H B P = I P H = P − 1 B − 1 P^HBP=I \\ P^H=P^{-1}B^{-1} PHBP=IPH=P1B1
    ∴ \therefore 得到
    P − 1 B − 1 A P = d i a g ( λ 1 , . . . , λ n ) P^{-1}B^{-1}AP=diag(\lambda_1,...,\lambda_n) P1B1AP=diag(λ1,...,λn)
    B − 1 A B^{-1}A B1A相似于对角矩阵,故 λ 1 , . . . , λ n \lambda_1,...,\lambda_n λ1,...,λn是矩阵 B − 1 A B^{-1}A B1A的特征值,即 λ 1 , . . . , λ n ) \lambda_1,...,\lambda_n) λ1,...,λn)是广义特征值问题的特征值。

    广义特征值问题 A x = λ B x Ax=\lambda Bx Ax=λBx,左乘 B − 1 B^{-1} B1,即为 B − 1 A x = λ x B^{-1}Ax=\lambda x B1Ax=λx

4 矩阵不等式

  • 定义

    A , B A,B A,B都是 n n n阶Hermite矩阵,如果 A − B ≥ 0 A-B\geq 0 AB0则称 A A A大于或等于 B B B(或称 B B B小于等于 A A A),记作 A ≥ B A\geq B AB(或 B ≤ A B\leq A BA), A − B A-B AB半正定;如果 A − B > 0 A-B>0 AB>0,则称 A A A大于 B B B(或称 B B B小于 A A A),记作 A > B A>B A>B(或 B < A B<A B<A),即== A − B A-B AB正定==。

  • 性质

    A , B , C A,B,C A,B,C均为 n n n阶Hermite矩阵,则

    1. A ≥ B ( A > B ) ⟺ − A ≤ − B ( − A < − B ) ⟺ A\geq B(A>B) \Longleftrightarrow-A\leq -B(-A<-B)\Longleftrightarrow AB(A>B)AB(A<B)对任意 n n n阶可逆矩阵 P P P都有 P H A P ≥ P H B P ( P H A P > P H B P ) P^HAP\geq P^HBP(P^HAP>P^HBP) PHAPPHBP(PHAP>PHBP)
    2. A > 0 ( A ≥ 0 ) , C > 0 ( C ≥ 0 ) A>0(A\geq 0),C>0(C\geq 0) A>0(A0),C>0(C0),且 A C = C A AC=CA AC=CA,则 A C > 0 ( A C ≥ 0 ) AC>0(AC\geq 0) AC>0(AC0)
    3. A > B A>B A>B P P P n × m n\times m n×m列满秩矩阵,则 P H A P > P H B P P^HAP>P^HBP PHAP>PHBP
    4. A ≥ B A\geq B AB P P P n × m n\times m n×m矩阵,则 P H A P ≥ P H B P P^HAP\geq P^HBP PHAPPHBP
  • 定理

    A , B A,B A,B都是 n n n阶Hermite矩阵,且 A ≥ 0 , B > 0 A\geq 0,B>0 A0,B>0,则

    1. B ≥ A B\geq A BA的充要条件是 ρ ( A B − 1 ) ≤ 1 \rho(AB^{-1})\leq 1 ρ(AB1)1
    2. B > A B>A B>A的充要条件是 ρ ( A B − 1 ) < 1 \rho(AB^{-1})<1 ρ(AB1)<1

    A A A n n n阶Hermite矩阵,则 λ m i n ( A ) I ≤ A ≤ λ m a x I \lambda_{min}(A)I\leq A\leq\lambda_{max}I λmin(A)IAλmaxI,这时 λ m i n \lambda_{min} λmin λ m a x \lambda_{max} λmax分别表示 A A A的最大和最小特征值。

    A , B A,B A,B均为 n n n阶Hermite正定矩阵,则

    1. A ≥ B > 0 A\geq B>0 AB>0,则 B − 1 ≥ A − 1 > 0 B^{-1}\geq A^{-1}>0 B1A1>0
    2. A > B > 0 A>B>0 A>B>0,则 B − 1 > A − 1 > 0 B^{-1}>A^{-1}>0 B1>A1>0

    A , B A,B A,B均为 n n n阶Hermite正定矩阵,且 A B = B A AB=BA AB=BA,则

    1. A ≥ B A\geq B AB,则 A 2 ≥ B 2 A^2\geq B^2 A2B2

      证明: A 2 − B 2 = ( A − B ) ( A + B ) = ( A + B ) ( A − B ) A^2-B^2=(A-B)(A+B)=(A+B)(A-B) A2B2=(AB)(A+B)=(A+B)(AB),易知 ( A − B ) ≥ 0 , A + B > 0 (A-B)\geq0,A+B>0 (AB)0,A+B>0,则克制

    2. A ≥ B A\geq B AB,则 A 2 > B 2 A^2> B^2 A2>B2

      同理得证

    A A A m × n m\times n m×n行满秩矩阵, B B B n × k n\times k n×k矩阵,则
    B H B ≥ ( A B ) H ( A A H ) − 1 ( A B ) B^HB\geq (AB)^H(AA^H)^{-1}(AB) BHB(AB)H(AAH)1(AB)
    等号成立当且仅当存在一个 m × k m\times k m×k矩阵 C C C使得 B = A H C B=A^HC B=AHC

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小丑西瓜9/article/detail/476336
推荐阅读
相关标签
  

闽ICP备14008679号