当前位置:   article > 正文

相似、合同、等价_合同,相似等价

合同,相似等价

一、相似矩阵

1. 特征值与特征向量

(1)定义

n n n 阶矩阵 A A A 满足 A α = λ α ( λ ≠ 0 ) A\alpha = \lambda\alpha (\lambda \neq 0) Aα=λα(λ=0),则 λ \lambda λ A A A 的特征值, α \alpha α A A A 的属于 λ \lambda λ 的特征向量, ∣ λ E − A ∣ = 0 |\lambda E-A|=0 λEA=0 A A A 的特征多项式。

【注】特征向量不能是零向量!

(2)特征值的性质

(2.1)设 A A A n n n 阶矩阵,特征值为 λ 1 , λ 2 , . . . , λ n \lambda_1, \lambda_2, ..., \lambda_n λ1,λ2,...,λn,则:

  • λ 1 + λ 2 + . . . + λ n = t r ( A ) = a 11 + a 22 + . . . + a n n \lambda_1 + \lambda_2 + ... + \lambda_n = tr(A) = a_{11} + a_{22} + ... + a_{nn} λ1+λ2+...+λn=tr(A)=a11+a22+...+ann
  • λ 1 λ 2 ⋅ ⋅ ⋅ λ n = ∣ A ∣ \lambda_1 \lambda_2 ··· \lambda_n = |A| λ1λ2⋅⋅⋅λn=A
  • A A A 有特征值 λ \lambda λ,则 λ \lambda λ 的重数 k ≥ n − r ( λ E − A ) k \geq n - r(\lambda E - A) knr(λEA)
  • r ( A ) ≤ 1 r(A) \leq 1 r(A)1,则 A A A 的特征值为 0 , 0 , . . . , 0 , t r ( A ) 0,0,...,0,tr(A) 0,0,...,0,tr(A)(有 n − 1 n-1 n1 0 0 0
  • A A A 为三角矩阵或对角矩阵,则 A A A 的特征值为主对角线上的元素
  • α ≠ 0 \alpha \neq 0 α=0,则矩阵 α β T \alpha \beta^{\mathrm{T}} αβT 的特征值为 0 , 0 , . . . , 0 , β T α 0,0,...,0,\beta^{\mathrm{T}} \alpha 0,0,...,0,βTα,其中特征值 β T α \beta^{\mathrm{T}} \alpha βTα 对应的特征向量为 α \alpha α

(2.2)设 A A A n n n实对称矩阵,则:

  • A A A 的元素均为实数,且 A T = A A^{\mathrm{T}}=A AT=A
  • A A A 的特征值必为实数
  • A = α β T + β α T A = \alpha\beta^{\mathrm{T}} + \beta\alpha^{\mathrm{T}} A=αβT+βαT 为实对称矩阵

(3)特征向量的性质

(3.1)设 A A A n n n 阶矩阵,则:

  • A A A 的不同特征值对应的特征向量线性无关
  • A A A 的不同特征值对应的特征向量之线性组合不是 A A A 的特征向量
  • A A A k k k 重特征值 λ \lambda λ,则属于 λ \lambda λ 的线性无关的特征向量个数 s = n − r ( λ E − A ) ≤ k s = n-r(\lambda E-A) \leq k s=nr(λEA)k
  • A A A k k k 重特征值 λ \lambda λ,则属于 λ \lambda λ 的线性无关的特征向量之线性组合仍为 A A A 的特征向量

(3.2)设 A A A n n n实对称矩阵,则:

  • A A A不同特征值的特征向量相互正交
  • A A A k k k 重特征值 λ \lambda λ,则属于 λ \lambda λ 的线性无关的特征向量个数 s = n − r ( λ E − A ) = k s = n-r(\lambda E-A) = k s=nr(λEA)=k

(4)常用结论

矩阵 A A A k A kA kA A n A^{n} An A + k E A+kE A+kE f ( A ) f(A) f(A) A − 1 A^{-1} A1 A ∗ A^* A P − 1 A P P^{-1}AP P1AP A T A^{\mathrm{T}} AT
特征值 λ \lambda λ k λ k\lambda λ n \lambda^{n} λn λ + k \lambda+k λ+k f ( λ ) f(\lambda) f(λ) 1 λ \frac{1}{\lambda} λ1 ∣ A ∣ λ \frac{|A|}{\lambda} λA λ \lambda λ λ \lambda λ
特征向量 α \alpha α α \alpha α α \alpha α α \alpha α α \alpha α α \alpha α α \alpha α P − 1 α P^{-1}\alpha P1α不一定是 α \alpha α

【注 1】关于 A A A f ( A ) f(A) f(A) 的几个要点:

  • f ( A ) = 0 f(A) = 0 f(A)=0,则 A A A 的每个特征值 λ \lambda λ 都满足 f ( λ ) = 0 f(\lambda)=0 f(λ)=0
  • f ( λ ) = 0 f(\lambda)=0 f(λ)=0 求得解 λ 1 , λ 2 , . . . , λ t \lambda_1, \lambda_2,..., \lambda_t λ1,λ2,...,λt,则 A A A 的特征值可能有 λ 1 , λ 2 , . . . , λ t \lambda_1, \lambda_2,..., \lambda_t λ1,λ2,...,λt 的其中几个(或一个都没有!),但不能确定 A A A 的特征值一定都有 λ 1 , λ 2 , . . . , λ t \lambda_1, \lambda_2,..., \lambda_t λ1,λ2,...,λt

【注 2】一个可以快速计算矩阵 A A A 的特征值的技巧:将 A A A 拆分成数量矩阵 k E kE kE 加一个秩为 1 1 1 的矩阵 B B B,于是 A = B + k E A=B+kE A=B+kE,矩阵 B B B 的特征值容易写出,自然也就得到矩阵 A A A 的特征值了。

2. 相似关系

(1)相似的定义

A , B A,B A,B n n n 阶矩阵,若存在可逆矩阵 P P P,使得 P − 1 A P = B P^{-1}AP=B P1AP=B(即 A P = P B AP=PB AP=PB),则称 A A A B B B 相似,记作 A ∽ B A∽B AB

(2)相似的性质

(2.1)对称性和传递性:

  • 对称性 A ∽ B ⇔ B ∽ A A∽B \Leftrightarrow B∽A ABBA
  • 传递性 A ∽ B , B ∽ C ⇒ A ∽ C A∽B, B∽C \Rightarrow A∽C AB,BCAC

(2.2)若 A ∽ B A∽B AB P − 1 A P = B P^{-1}AP=B P1AP=B 时,有:

  • A ∽ B ⇒ A T ∽ B T A∽B \Rightarrow A^{\mathrm{T}}∽B^{\mathrm{T}} ABATBT
  • A ∽ B ⇒ A n ∽ B n A∽B \Rightarrow A^n∽B^n ABAnBn
  • A ∽ B ⇒ A − 1 ∽ B − 1 A∽B \Rightarrow A^{-1}∽B^{-1} ABA1B1,并且 P − 1 A − 1 P = B − 1 P^{-1} A^{-1} P = B^{-1} P1A1P=B1(当 A A A 可逆时)
  • A ∽ B ⇒ A ∗ ∽ B ∗ A∽B \Rightarrow A^*∽B^* ABAB,并且 P − 1 A ∗ P = B ∗ P^{-1} A^* P = B^* P1AP=B(当 A A A 可逆时)
  • A ∽ B ⇒ f ( A ) ∽ f ( B ) A∽B \Rightarrow f(A)∽f(B) ABf(A)f(B),并且 P − 1 f ( A ) P = f ( B ) P^{-1} f(A) P = f(B) P1f(A)P=f(B)
  • η \eta η A A A 的特征向量 ⇔ P − 1 η \Leftrightarrow P^{-1} \eta P1η B B B 的特征向量
  • A ∽ B ⇒ ∣ A ∣ = ∣ B ∣ A∽B \Rightarrow |A|=|B| ABA=B
  • A ∽ B ⇒ ∣ λ E − A ∣ = ∣ λ E − B ∣ A∽B \Rightarrow |\lambda E-A| = |\lambda E-B| ABλEA=λEB
  • A ∽ B ⇒ r ( A ) = r ( B ) A∽B \Rightarrow r(A)=r(B) ABr(A)=r(B)
  • A ∽ B ⇒ t r ( A ) = t r ( B ) A∽B \Rightarrow tr(A)=tr(B) ABtr(A)=tr(B)
  • A ∽ B ⇒ A A∽B \Rightarrow A ABA B B B 有相同的特征值

【注 1】由 A ∽ B A∽B AB 可得出以上结论,但反过来,这些条件却并不能得到 A ∽ B A∽B AB
【注 2】以上条件只要有一个不满足,即可判断 A A A 不相似于 B B B
【注 3】若要判断 A ∽ B A∽B AB,则可尝试求出 A A A B B B 的对角矩阵,若它们都相似于同一个对角矩阵(即 A ∽ Λ , B ∽ Λ A∽\Lambda,B∽\Lambda AΛ,BΛ),则根据相似的传递性,可得 A ∽ B A∽B AB

(2.3)设 A , B A,B A,B 均为 n n n实对称矩阵,则:

  • A A A 必相似于实对角矩阵,即 A ∽ Λ A∽\Lambda AΛ
  • A ∽ B ⇔ A A∽B \Leftrightarrow A ABA B B B 有相同的特征值及重数 ⇔ ∣ λ E − A ∣ = ∣ λ E − B ∣ \Leftrightarrow |\lambda E-A| = |\lambda E-B| λEA=λEB

【注】 ∣ λ E − A ∣ = ∣ λ E − B ∣ ⇔ |\lambda E-A| = |\lambda E-B| \Leftrightarrow λEA=λEB A A A B B B 有相同的特征值及重数 ⇔ A ∽ Λ , B ∽ Λ ⇔ A ∽ B \Leftrightarrow A∽\Lambda,B∽\Lambda \Leftrightarrow A∽B AΛ,BΛAB

  • 存在正交矩阵 Q Q Q,使得 Q T A Q = Q − 1 A Q = Λ Q^{\mathrm{T}}AQ = Q^{-1}AQ = \Lambda QTAQ=Q1AQ=Λ

3. 相似对角化

(1)相似对角化的定义

n n n 阶对角矩阵 Λ = d i a g ( λ 1 , λ 2 , . . . , λ n ) \Lambda = \mathrm{diag}(\lambda_1,\lambda_2,...,\lambda_n) Λ=diag(λ1,λ2,...,λn),其中 λ i \lambda_i λi A A A 的特征值, 若存在可逆矩阵 P P P,使得 P − 1 A P = Λ P^{-1}AP=\Lambda P1AP=Λ(即 A P = P Λ AP=P\Lambda AP=PΛ),则称 A A A相似对角化,简称为可对角化,记作 A ∽ Λ A∽\Lambda AΛ

(2)可对角化的判别

(设 A A A n n n 阶矩阵)

  • A A A n n n 个不同的特征值 ⇒ A ∽ Λ \Rightarrow A∽\Lambda AΛ
  • A ∽ Λ ⇔ A A∽\Lambda \Leftrightarrow A AΛA n n n 个线性无关的特征向量
  • A ∽ Λ ⇔ A A∽\Lambda \Leftrightarrow A AΛA k k k 重特征值 λ \lambda λ k k k 个线性无关的特征向量 ⇔ k = n − r ( λ E − A ) \Leftrightarrow k = n-r(\lambda E-A) k=nr(λEA)

【注】当 k = 1 k=1 k=1 时, k = n − r ( λ E − A ) k = n-r(\lambda E-A) k=nr(λEA) 一定成立,因此只需对 k ≥ 2 k \geq 2 k2 的特征值进行判断。

  • A A A 满足 ( A − a E ) ( A − b E ) = 0 ( a ≠ b ) ⇔ A ∽ Λ (A-aE)(A-bE)=0 (a \neq b) \Leftrightarrow A∽\Lambda (AaE)(AbE)=0(a=b)AΛ,且特征值满足 ( λ − a ) ( λ − b ) = 0 (\lambda-a)(\lambda-b)=0 (λa)(λb)=0
  • 实对称矩阵必可相似对角化,且正交于对角矩阵

(3)相似对角化的步骤

(3.1)一般矩阵 A A A 的相似对角化的步骤:

  • ∣ λ E − A ∣ = 0 |\lambda E - A|=0 λEA=0 求出 A A A 的特征值 λ 1 , λ 2 , . . . , λ n \lambda_1,\lambda_2,...,\lambda_n λ1,λ2,...,λn
  • 对每个 λ i \lambda_i λi,由 ( λ i E − A ) x = 0 (\lambda_i E - A)x=0 (λiEA)x=0 求出 A A A 的一组特征向量 α 1 , α 2 , . . . , α n \alpha_1,\alpha_2,...,\alpha_n α1,α2,...,αn
  • P = ( α 1 , α 2 , . . . , α n ) P=(\alpha_1,\alpha_2,...,\alpha_n) P=(α1,α2,...,αn),当 P P P 可逆时,有 P − 1 A P = Λ = d i a g ( λ 1 , λ 2 , . . . , λ n ) P^{-1}AP=\Lambda= \mathrm{diag}(\lambda_1,\lambda_2,...,\lambda_n) P1AP=Λ=diag(λ1,λ2,...,λn)

【注】有些题目没有给出具体的矩阵 A A A,只给定一些已知的特征值和特征向量,要求反求出矩阵 A A A。有两种解法:

  • 传统的解法:求出对角矩阵 Λ = d i a g ( λ 1 , λ 2 , λ 3 ) \Lambda = \mathrm{diag}(\lambda_1,\lambda_2,\lambda_3) Λ=diag(λ1,λ2,λ3) 和可逆矩阵 P = ( α 1 , α 2 , α 3 ) P=(\alpha_1,\alpha_2,\alpha_3) P=(α1,α2,α3),然后由 P − 1 A P = Λ P^{-1}AP=\Lambda P1AP=Λ 得到 A = P Λ P − 1 A=P \Lambda P^{-1} A=PΛP1。这种解法需要对 P P P 求逆(需使用初等行变换求出),然后进行两次矩阵乘法。
  • 较快的解法:求解矩阵 A A A 的过程实际上是在求解一个矩阵方程。因为 P − 1 A P = Λ ⇔ A P = P Λ ⇔ A ( α 1 , α 2 , α 3 ) = ( λ 1 α 1 , λ 2 α 2 , λ 3 α 3 ) P^{-1}AP=\Lambda \Leftrightarrow AP=P\Lambda \Leftrightarrow A(\alpha_1,\alpha_2,\alpha_3)=(\lambda_1 \alpha_1,\lambda_2 \alpha_2,\lambda_3 \alpha_3) P1AP=ΛAP=PΛA(α1,α2,α3)=(λ1α1,λ2α2,λ3α3),取转置即得矩阵方程 ( α 1 , α 2 , α 3 ) T A T = ( λ 1 α 1 , λ 2 α 2 , λ 3 α 3 ) T (\alpha_1,\alpha_2,\alpha_3)^{\mathrm{T}} A^{\mathrm{T}} = (\lambda_1 \alpha_1,\lambda_2 \alpha_2,\lambda_3 \alpha_3)^{\mathrm{T}} (α1,α2,α3)TAT=(λ1α1,λ2α2,λ3α3)T,于是求解 A T A^{\mathrm{T}} AT 只需进行初等行变换: ( α 1 T , α 2 T , α 3 T ∣ λ 1 α 1 T , λ 2 α 2 T , λ 3 α 3 T ) → ( E ∣ A T ) (\alpha_1^\mathrm{T},\alpha_2^\mathrm{T},\alpha_3^\mathrm{T} | \lambda_1 \alpha_1^\mathrm{T},\lambda_2 \alpha_2^\mathrm{T},\lambda_3 \alpha_3^\mathrm{T}) \rightarrow (E|A^{\mathrm{T}}) (α1T,α2T,α3Tλ1α1T,λ2α2T,λ3α3T)(EAT)。显然该法比传统解法要更快!

(3.2)实对称矩阵 A A A 的相似对角化的步骤:

  • ∣ λ E − A ∣ = 0 |\lambda E - A|=0 λEA=0 求出 A A A 的特征值 λ 1 , λ 2 , . . . , λ n \lambda_1,\lambda_2,...,\lambda_n λ1,λ2,...,λn
  • 对每个 λ i \lambda_i λi,由 ( λ i E − A ) x = 0 (\lambda_i E - A)x=0 (λiEA)x=0 求出 A A A 的一组特征向量 α 1 , α 2 , . . . , α n \alpha_1,\alpha_2,...,\alpha_n α1,α2,...,αn
  • 对单重特征值的特征向量进行单位化;对多重特征值对应的特征向量进行施密特正交化单位化
  • 令正交矩阵 Q = ( η 1 , η 2 , . . . , η n ) Q=(\eta_1,\eta_2,...,\eta_n) Q=(η1,η2,...,ηn),有 Q T A Q = Q − 1 A Q = Λ = d i a g ( λ 1 , λ 2 , . . . , λ n ) Q^{\mathrm{T}}AQ = Q^{-1}AQ=\Lambda= \mathrm{diag}(\lambda_1,\lambda_2,...,\lambda_n) QTAQ=Q1AQ=Λ=diag(λ1,λ2,...,λn)

【注 1】有些题目没有给出具体的实对称矩阵 A A A,只给出其中一个或两个特征向量 α \alpha α,若需要算出其他的特征向量,应使用“实对称矩阵的不同特征值的特征向量相互正交”这一性质来求解。

【注 2】有些题目没有给出具体的实对称矩阵 A A A,只给定一些已知的特征值和特征向量,要求反求出实对称矩阵 A A A,一种比较快的解法是使用谱分解定理,在本人专栏有涉及。

(3.3)施密特正交化

{ β 1 = α 1 β 2 = α 2 − ( α 2 , β 1 ) ( β 1 , β 1 ) β 1 β 3 = α 3 − ( α 3 , β 1 ) ( β 1 , β 1 ) β 1 − ( α 3 , β 2 ) ( β 2 , β 2 ) β 2 \left\{

β1=α1β2=α2(α2,β1)(β1,β1)β1β3=α3(α3,β1)(β1,β1)β1(α3,β2)(β2,β2)β2
\right. β1=α1β2=α2(β1,β1)(α2,β1)β1β3=α3(β1,β1)(α3,β1)β1(β2,β2)(α3,β2)β2

【注】施密特正交化的推导过程以及其延伸出的一些解题思路,可见本人专栏的另一篇文章。

(3.4)单位化

{ η 1 = β 1 / ∣ ∣ β 1 ∣ ∣ η 2 = β 2 / ∣ ∣ β 2 ∣ ∣ η 3 = β 3 / ∣ ∣ β 3 ∣ ∣ \left\{

η1=β1/||β1||η2=β2/||β2||η3=β3/||β3||
\right. η1=β1/∣∣β1∣∣η2=β2/∣∣β2∣∣η3=β3/∣∣β3∣∣

∣ ∣ β i ∣ ∣ ||\beta_i|| ∣∣βi∣∣ 为向量的长度)

令正交矩阵 Q = ( η 1 , η 2 , η 3 ) Q=(\eta_1,\eta_2,\eta_3) Q=(η1,η2,η3),有 Q T A Q = Q − 1 A Q = Λ = d i a g ( λ 1 , λ 2 , λ 3 ) Q^{\mathrm{T}}AQ = Q^{-1}AQ=\Lambda= \mathrm{diag}(\lambda_1,\lambda_2,\lambda_3) QTAQ=Q1AQ=Λ=diag(λ1,λ2,λ3)

二、合同矩阵

1. 二次型

(1)二次型的定义

  • 二次型 f ( x 1 , x 2 , . . . , x n ) = x T A x f(x_1,x_2,...,x_n)=x^{\mathrm{T}}Ax f(x1,x2,...,xn)=xTAx,其中 A A A 是实对称矩阵。
  • 标准二次型:若交叉项的系数为 0 0 0,则得到标准二次型 A A A 是实对角矩阵。
  • 规范二次型:若每一项去掉系数,只保留正负,则得到规范二次型 A A A 是实规范对角矩阵,即 [ E p − E q O ] \left[
    EpEqO
    \right]
    EpEqO
    ,其中 p p p正惯性指数(正平方项个数), q q q负惯性指数(负平方项个数)。

【注 1】标准二次型是不唯一的,规范二次型是唯一的。

【注 2】部分二次型所对应的矩阵不是实对称矩阵,则需要将其改成实对称矩阵: B = 1 2 ( A + A T ) B = \frac{1}{2} (A + A^{\mathrm{T}}) B=21(A+AT)。相关例题: f ( x 1 , x 2 , x 3 ) = ( x 1 + 2 x 2 + 3 x 3 ) ( x 1 − 2 x 2 + 3 x 3 ) f(x_1,x_2,x_3) = (x_1 + 2x_2 + 3x_3) (x_1 - 2x_2 + 3x_3) f(x1,x2,x3)=(x1+2x2+3x3)(x12x2+3x3)

  • 可逆线性变量替换:对二次型 f ( x 1 , x 2 , . . . , x n ) = x T A x f(x_1,x_2,...,x_n)=x^{\mathrm{T}}Ax f(x1,x2,...,xn)=xTAx 引进新变量 y 1 , y 2 , . . . , y n y_1,y_2,...,y_n y1,y2,...,yn 用来表示 x 1 , x 2 , . . . , x n x_1,x_2,...,x_n x1,x2,...,xn

{ x 1 = c 11 y 1 + c 12 y 2 + . . . + c 1 n y n x 2 = c 21 y 1 + c 22 y 2 + . . . + c 2 n y n . . . . . . . . . . . . . . . . . . x 3 = c n 1 y 1 + c n 2 y 2 + . . . + c n n y n \left\{

x1=c11y1+c12y2+...+c1nynx2=c21y1+c22y2+...+c2nyn..................x3=cn1y1+cn2y2+...+cnnyn
\right. x1=c11y1+c12y2+...+c1nynx2=c21y1+c22y2+...+c2nyn..................x3=cn1y1+cn2y2+...+cnnyn

将其中的系数矩阵记为 C C C,若 C C C 为可逆矩阵,则称为可逆线性变量替换,上式又可写成: x = C y x=Cy x=Cy,所以二次型可化为: f ( x 1 , x 2 , . . . , x n ) = y T C T A C y f(x_1,x_2,...,x_n)=y^{\mathrm{T}}C^{\mathrm{T}}ACy f(x1,x2,...,xn)=yTCTACy,可逆线性变量替换后的二次型为 g ( y 1 , y 2 , . . . , y n ) = C T A C g(y_1,y_2,...,y_n)=C^{\mathrm{T}}AC g(y1,y2,...,yn)=CTAC

【注】坐标变换必须可逆,若不可逆则变换后的结果不是二次型 f f f 的标准型。相关例题: f ( x 1 , x 2 , x 3 ) = ( x 1 + x 2 ) 2 + ( x 2 − x 3 ) 2 + ( x 3 + x 1 ) 2 f(x_1,x_2,x_3) = (x_1 + x_2)^2 + (x_2 - x_3)^2 + (x_3 + x_1)^2 f(x1,x2,x3)=(x1+x2)2+(x2x3)2+(x3+x1)2

(2)惯性定理

标准二次型 f = x T A x f=x^{\mathrm{T}}Ax f=xTAx 中, A A A实对称矩阵 p p p 为正惯性指数(正平方项个数), q q q 为负惯性指数(负平方项个数),则 r ( A ) = p + q r(A)=p+q r(A)=p+q

【注】必须是在实对称矩阵的条件下!

【一类特殊的二次型】已知二次型

f ( x 1 , x 2 , x 3 ) = ( a 1 x 1 + a 2 x 2 + a 3 x 3 ) 2 + ( b 1 x 1 + b 2 x 2 + b 3 x 3 ) 2 + ( c 1 x 1 + c 2 x 2 + c 3 x 3 ) 2 f(x_1, x_2, x_3) = (a_1x_1 + a_2x_2 + a_3x_3)^2 + (b_1x_1 + b_2x_2 + b_3x_3)^2 + (c_1x_1 + c_2x_2 + c_3x_3)^2 f(x1,x2,x3)=(a1x1+a2x2+a3x3)2+(b1x1+b2x2+b3x3)2+(c1x1+c2x2+c3x3)2

α = ( a 1 , a 2 , a 3 ) T , β = ( b 1 , b 2 , b 3 ) T , γ = ( c 1 , c 2 , c 3 ) T \alpha = (a_1, a_2, a_3)^{\mathrm{T}}, \beta = (b_1, b_2, b_3)^{\mathrm{T}}, \gamma = (c_1, c_2, c_3)^{\mathrm{T}} α=(a1,a2,a3)T,β=(b1,b2,b3)T,γ=(c1,c2,c3)T,则二次型 f ( x 1 , x 2 , x 3 ) f(x_1, x_2, x_3) f(x1,x2,x3) 对应矩阵为 A = ( α , β , γ ) ( α , β , γ ) T A = (\alpha, \beta, \gamma) (\alpha, \beta, \gamma)^{\mathrm{T}} A=(α,β,γ)(α,β,γ)T,正惯性指数 p = r ( α , β , γ ) p=r(\alpha, \beta, \gamma) p=r(α,β,γ),负惯性指数 q = 0 q=0 q=0

(3)最大和最小值

n n n 元二次型 f = x T A x f=x^{\mathrm{T}}Ax f=xTAx,其中实对称矩阵 A A A 的特征值 λ 1 , λ 2 , . . . , λ n \lambda_1,\lambda_2,...,\lambda_n λ1,λ2,...,λn 中最大值为 λ m a x \lambda_{max} λmax,最小值为 λ m i n \lambda_{min} λmin,且 x T A x = M > 0 x^{\mathrm{T}}Ax = M > 0 xTAx=M>0,则有:

M λ m i n ≤ x T A x ≤ M λ m a x M \lambda_{min} \leq x^{\mathrm{T}}Ax \leq M \lambda_{max} MλminxTAxMλmax

(4)二次型的标准化(合同对角化)

(4.1)正交变换法

  • ∣ λ E − A ∣ = 0 |\lambda E - A|=0 λEA=0 求出二次型矩阵 A A A 的特征值 λ 1 , λ 2 , . . . , λ n \lambda_1,\lambda_2,...,\lambda_n λ1,λ2,...,λn
  • 对每个 λ i \lambda_i λi,由 ( λ i E − A ) x = 0 (\lambda_i E - A)x=0 (λiEA)x=0 求出 A A A 的一组特征向量 α 1 , α 2 , . . . , α n \alpha_1,\alpha_2,...,\alpha_n α1,α2,...,αn
  • 对单重特征值的特征向量进行单位化;对多重特征值对应的特征向量进行施密特正交化单位化
  • 令正交矩阵 Q = ( η 1 , η 2 , . . . , η n ) Q=(\eta_1,\eta_2,...,\eta_n) Q=(η1,η2,...,ηn),有可逆线性变量替换 x = Q y x=Qy x=Qy,把原二次型化为标准二次型, A A A 的特征值 λ 1 , λ 2 , . . . , λ n \lambda_1,\lambda_2,...,\lambda_n λ1,λ2,...,λn 对应标准二次型中每一项的系数

(4.2)拉格朗日配方法

  • 若二次型中有平方项 x i 2 x_i^2 xi2 和交叉项 x i x j x_ix_j xixj,则把含有 x i x_i xi 的项集中起来进行配方
  • 若二次型中仅有交叉项 x i x j x_ix_j xixj,则进行以下换元,此时将产生出平方项,按第一种方法进行配方:

{ x i = y i + y j x j = y i − y j x k = y k ( k = 1 , 2 , . . . , n ) ( k ≠ i , j ) \left\{

xi=yi+yjxj=yiyjxk=yk(k=1,2,...,n)(ki,j)
\right. xi=yi+yjxj=yiyjxk=yk(k=1,2,...,n)(k=i,j)

  • 也可使用公式 a b = ( a + b ) 2 − ( a − b ) 2 4 ab = \frac{(a+b)^2 - (a-b)^2}{4} ab=4(a+b)2(ab)2 产生出平方项

【例】用配方法将二次型 f ( x 1 , x 2 , x 3 ) = x 1 x 2 + x 2 x 3 + x 1 x 3 f(x_1,x_2,x_3) = x_1x_2 + x_2x_3 + x_1x_3 f(x1,x2,x3)=x1x2+x2x3+x1x3 化为标准型。

【解】根据交叉项 x 1 x 2 x_1x_2 x1x2 可进行以下换元(当然也可以挑选其他交叉项进行换元):

{ x 1 = y 1 + y 2 x 2 = y 1 − y 2 x 3 = y 3 \left\{

x1=y1+y2x2=y1y2x3=y3
\right. x1=y1+y2x2=y1y2x3=y3

所以 f ( x 1 , x 2 , x 3 ) = y 1 2 + y 2 2 + 2 y 1 y 3 f(x_1,x_2,x_3) = y_1^2 + y_2^2 + 2y_1y_3 f(x1,x2,x3)=y12+y22+2y1y3,配方得 f ( x 1 , x 2 , x 3 ) = ( y 1 + y 3 ) 2 − y 2 2 − y 3 2 f(x_1,x_2,x_3) = (y_1+y_3)^2 - y_2^2 - y_3^2 f(x1,x2,x3)=(y1+y3)2y22y32

2. 合同关系

(1)合同的定义

n n n 阶矩阵 A , B A,B A,B,若存在可逆实矩阵 C C C,使得 B = C T A C B=C^{\mathrm{T}}AC B=CTAC,则称 A A A B B B 合同,记为 A ≃ B A≃B AB

【注】在矩阵合同的定义中,并没有要求合同的矩阵一定是实对称矩阵。

(2)合同的性质

(2.1)一般矩阵的性质(设 A , B A,B A,B 为一般矩阵):

  • 两个二次型(分别对应实对称矩阵 A , B A,B A,B)可用可逆线性变量替换互相转化 ⇔ A ≃ B \Leftrightarrow A≃B AB
  • A ≃ B ⇔ A≃B \Leftrightarrow AB 正、负惯性指数相同,即 p A = p B , q A = q B p_A=p_B, q_A=q_B pA=pB,qA=qB
  • A ≃ B ⇔ A≃B \Leftrightarrow AB 正、负特征值个数相同
  • A ≃ B ⇒ r ( A ) = r ( B ) A≃B \Rightarrow r(A)=r(B) ABr(A)=r(B)

【注】 A ≃ B ⇒ p A = p B , q A = q B ⇒ r ( A ) = r ( B ) A≃B \Rightarrow p_A=p_B, q_A=q_B \Rightarrow r(A)=r(B) ABpA=pB,qA=qBr(A)=r(B),但 r ( A ) = r ( B ) ⇏ A ≃ B r(A)=r(B) \nRightarrow A≃B r(A)=r(B)AB,只能推出 A A A B B B 等价(若 A , B A,B A,B 同型)。

  • A ∽ B ⇎ A ≃ B A∽B \nLeftrightarrow A≃B ABAB

【注】这是在一般矩阵下的得出的结论:

  • 合同不一定相似:很容易理解,合同只能推出矩阵 A , B A,B A,B 所对应的对角矩阵元素的正负个数相等,但无法推出对角矩阵元素均相等。
  • 相似不一定合同:由 A ∽ B A∽B AB 可得 P − 1 A P = B P^{-1}AP=B P1AP=B,但无法保证 P − 1 = P T P^{-1} = P^{\mathrm{T}} P1=PT

(2.2)实对称矩阵的性质(设 A , B A,B A,B 为实对称矩阵):

  • 实对称矩阵必能合同对角化,即 C T A C = Λ C^{\mathrm{T}}AC = \Lambda CTAC=Λ
  • A A A 为实对称矩阵,则: A ≃ B ⇒ B A≃B \Rightarrow B ABB 为实对称矩阵

【证明】 A ≃ B ⇒ C T A C = B ⇒ ( C T A C ) T = ( B ) T ⇒ C T A T C = B T = B A≃B \Rightarrow C^{\mathrm{T}}AC = B \Rightarrow (C^{\mathrm{T}}AC)^{\mathrm{T}} = (B)^{\mathrm{T}} \Rightarrow C^{\mathrm{T}}A^{\mathrm{T}}C = B^{\mathrm{T}} = B ABCTAC=B(CTAC)T=(B)TCTATC=BT=B,说明 B B B 也为实对称矩阵。

  • A ∽ B ⇒ A ≃ B A∽B \Rightarrow A≃B ABAB,但 A ∽ B ⇍ A ≃ B A∽B \nLeftarrow A≃B ABAB

【注】这是在实对称矩阵下的得出的结论:

  • 相似是合同的特例:实对称矩阵必与对角矩阵相似,可得 A ∽ B ⇒ A ∽ B ∽ Λ A∽B \Rightarrow A∽B∽\Lambda ABABΛ,所以 A , B A,B A,B 有相同的特征值,即 A , B A,B A,B 有相同的正、负惯性指数,由惯性定理知 A ≃ B A≃B AB
  • 合同不一定相似:很容易理解,合同只能推出矩阵 A , B A,B A,B 所对应的对角矩阵元素的正负个数相等,但无法推出对角矩阵元素均相等。

3. 正定矩阵

(1)正定的定义

设二次型 f ( x 1 , x 2 , . . . , x n ) = x T A x f(x_1,x_2,...,x_n) = x^{\mathrm{T}}Ax f(x1,x2,...,xn)=xTAx,其中 A A A 是实对称矩阵。若对任意 x ≠ 0 x \neq 0 x=0,都有 f ( x 1 , x 2 , . . . , x n ) = x T A x > 0 f(x_1,x_2,...,x_n) = x^{\mathrm{T}}Ax > 0 f(x1,x2,...,xn)=xTAx>0,则称二次型 f f f 正定,称 A A A正定矩阵

【注 1】判定矩阵 A A A 正定时,需要检验 A A A 是否为实对称矩阵。
【注 2】若二次型 f f f 正定,则仅当 x = 0 x = 0 x=0 时, f ( x 1 , x 2 , . . . , x n ) = x T A x = 0 f(x_1,x_2,...,x_n) = x^{\mathrm{T}}Ax = 0 f(x1,x2,...,xn)=xTAx=0

(2)正定的性质

  • A A A 正定 ⇒ A \Rightarrow A A 为实对称矩阵
  • A A A 正定 ⇔ A \Leftrightarrow A A 的特征值全部大于 0 0 0
  • A A A 正定 ⇔ A \Leftrightarrow A A 的顺序主子式全大于 0 0 0
  • A A A 正定 ⇔ ∃ 可逆 P \Leftrightarrow \exist可逆P 可逆P,使得 A = P T P ⇔ A ≃ E A=P^{\mathrm{T}}P \Leftrightarrow A≃E A=PTPAE
  • A A A 正定 ⇒ a i i > 0 \Rightarrow a_{ii} > 0 aii>0
  • A A A 正定 ⇒ ∣ A ∣ > 0 \Rightarrow |A| > 0 A>0
  • A A A 正定 ⇒ A k , A − 1 , A ∗ \Rightarrow A^k, A^{-1}, A^* Ak,A1,A 均正定
  • [ A O O B ] \left[
    AOOB
    \right]
    [AOOB]
    正定 ⇔ A , B \Leftrightarrow A,B A,B 均正定
  • 对于实矩阵 A T A A^{\mathrm{T}}A ATA
    • A T A A^{\mathrm{T}}A ATA 的负惯性指数为 0 0 0
    • r ( A ) = n r(A)=n r(A)=n,则 A T A A^{\mathrm{T}}A ATA 正定

【证明】(1)首先证明矩阵 A T A A^{\mathrm{T}}A ATA 为实对称矩阵。因为 ( A T A ) T = A T ( A T ) T = A T A (A^{\mathrm{T}}A)^{\mathrm{T}} = A^{\mathrm{T}} (A^{\mathrm{T}})^{\mathrm{T}} = A^{\mathrm{T}} A (ATA)T=AT(AT)T=ATA,所以 A T A A^{\mathrm{T}}A ATA 为实对称矩阵。

(2)现在用特征值证明其正定。设 λ \lambda λ 是矩阵 A T A A^{\mathrm{T}}A ATA 的特征值,所对应的特征向量为 α \alpha α,则有: A T A α = λ α A^{\mathrm{T}}A \alpha = \lambda \alpha ATAα=λα,等式两边同乘 α T \alpha^{\mathrm{T}} αT 得: α T A T A α = λ α T α \alpha^{\mathrm{T}} A^{\mathrm{T}}A \alpha = \lambda \alpha^{\mathrm{T}} \alpha αTATAα=λαTα,化为内积形式即: ( A α , A α ) = λ ( α , α ) (A\alpha,A\alpha) = \lambda (\alpha, \alpha) (Aα,Aα)=λ(α,α),显然 λ ≥ 0 \lambda \geq 0 λ0,矩阵 A T A A^{\mathrm{T}}A ATA 负惯性指数为 0 0 0

(3)当 r ( A ) = n r(A)=n r(A)=n 时,表示 A x = 0 Ax=0 Ax=0 仅有非零解,所以 A α ≠ 0 A \alpha \neq 0 Aα=0 ( A α , A α ) > 0 (A\alpha,A\alpha) > 0 (Aα,Aα)>0,显然 λ > 0 \lambda > 0 λ>0,矩阵 A T A A^{\mathrm{T}}A ATA 正定。

三、等价关系

1. 等价的定义

若矩阵 A A A 经过有限次初等变换变成矩阵 B B B,则称矩阵 A A A 与矩阵 B B B 等价,记为 A ≅ B A \cong B AB

2. 等价的判定

A , B A,B A,B 是同型矩阵,则:

  • A ≅ B ⇔ A A \cong B \Leftrightarrow A ABA 经过初等变换得到 B B B
  • A ≅ B ⇔ P A Q = B A \cong B \Leftrightarrow PAQ=B ABPAQ=B,其中 P , Q P,Q P,Q 可逆
  • A ≅ B ⇔ r ( A ) = r ( B ) A \cong B \Leftrightarrow r(A) = r(B) ABr(A)=r(B)
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/从前慢现在也慢/article/detail/980670
推荐阅读
相关标签
  

闽ICP备14008679号