当前位置:   article > 正文

人工智能数学基础之线性代数(三)_证明ai均为非零列向量

证明ai均为非零列向量

前言

本文只会记录人工智能中所用到的线性代数知识,并不会记录大学线性代数教材中的所有知识。

现在CSDN不能发超长的文章了,只能分成多篇发布。

人工智能数学基础之线性代数(一)
人工智能数学基础之线性代数(二)
人工智能数学基础之线性代数(三)

矩阵的逆

方阵的行列式

定义6 n n n阶方阵 A A A的元素所构成的行列式,称为方阵 A A A的行列式,记作 ∣ A ∣ |A| A d e t A det A detA

A A A确定 ∣ A ∣ |A| A的这个运算满足下述运算规律(设 A , B A,B A,B n n n阶方阵, λ \lambda λ为数):

  1. ∣ A T ∣ = ∣ A ∣ |A^T|=|A| AT=A (行列式性质1)
  2. ∣ λ A ∣ = λ n ∣ A ∣ |\lambda A| = \lambda^n |A| λA=λnA
  3. ∣ A B ∣ = ∣ A ∣ ∣ B ∣ |AB| = |A||B| AB=A∣∣B

行列式 ∣ A ∣ |A| A的各个元素的代数余子式 A i j A_{ij} Aij所构成的如下的矩阵(注意是转置排法)
A ∗ = ( A 11 A 21 ⋯ A n 1 A 12 A 22 ⋯ A n 2 ⋮ ⋮ ⋮ A 1 n A 2 n ⋯ A n n ) , A^* =(A11A21An1A12A22An2A1nA2nAnn)

, A= A11A12A1nA21A22A2nAn1An2Ann ,
称为矩阵 A A A的伴随矩阵,简称伴随阵。

试证
A A ∗ = A ∗ A = ∣ A ∣ E AA^* = A^*A = |A|E AA=AA=AE

A A ∗ = ( a 11 a 12 ⋯ a 1 n a 21 a 22 ⋯ a 2 n ⋮ ⋮ ⋮ a n 1 a n 2 ⋯ a n n ) ( A 11 A 21 ⋯ A n 1 A 12 A 22 ⋯ A n 2 ⋮ ⋮ ⋮ A 1 n A 2 n ⋯ A n n ) = ( ∣ A ∣ ∣ A ∣ ⋱ ∣ A ∣ ) = ∣ A ∣ E AA^* =(a11a12a1na21a22a2nan1an2ann)

(A11A21An1A12A22An2A1nA2nAnn)
= (|A||A||A|)
= |A| E AA= a11a21an1a12a22an2a1na2nann A11A12A1nA21A22A2nAn1An2Ann = AAA =AE

逆矩阵

A A A n n n阶方阵( n × n n×n n×n),若存在 n n n阶方阵 B B B使得: A B = B A = E AB=BA=E AB=BA=E,则称 A A A是可逆的(或非奇异的)且矩阵 B B B是矩阵 A A A的逆矩阵,记为 A − 1 = B A^{-1} = B A1=B
矩阵 B B B称为 A A A的逆矩阵,简称逆阵。

B B B C C C均为 A A A的逆矩阵,则
B = B E = B ( A C ) = ( B A ) C = E C = C B = BE= B(AC) = (BA)C = EC = C B=BE=B(AC)=(BA)C=EC=C
因此一个矩阵最多有一个逆矩阵。

定理1 若矩阵 A A A可逆,则 ∣ A ∣ ≠ 0 |A| \neq 0 A=0

A A A可逆,即有 A − 1 A^{-1} A1,使 A A − 1 = E AA^{-1}=E AA1=E。故 ∣ A ∣ ⋅ ∣ A − 1 ∣ = ∣ E ∣ = 1 |A|\cdot |A^{-1}| = |E| =1 AA1=E=1,所以 ∣ A ∣ ≠ 0 |A| \neq 0 A=0

定理2 ∣ A ∣ ≠ 0 |A| \neq 0 A=0,则矩阵 A A A可逆,且
A − 1 = 1 ∣ A ∣ A ∗ (1) A^{-1} = \frac{1}{|A|}A^* \tag{1} A1=A1A(1)
其中 A ∗ A^* A为矩阵 A A A的伴随阵。

我们已知
A A ∗ = A ∗ A = ∣ A ∣ E AA^* = A^*A = |A|E AA=AA=AE
因为 ∣ A ∣ ≠ 0 |A| \neq 0 A=0,(等式两边同时乘以 1 ∣ A ∣ \frac{1}{|A|} A1)故有
A 1 ∣ A ∣ A ∗ = 1 ∣ A ∣ A ∗ A = E , A\frac{1}{|A|} A^* = \frac{1}{|A|}A^*A =E, AA1A=A1AA=E,
所以,按逆矩阵的定义,即知 A A A可逆,且
A − 1 = 1 ∣ A ∣ A ∗ . A^{-1}= \frac{1}{|A|}A^*. A1=A1A.

∣ A ∣ = 0 |A|=0 A=0时, A A A称为奇异矩阵,否则称非奇异矩阵。由上面两定理可知: A A A是可逆矩阵的充分必要条件是 ∣ A ∣ ≠ 0 |A| \neq 0 A=0,即可逆矩阵就是非奇异矩阵。

由定理2,可得下述推论。

推论 A B = E AB=E AB=E(或 B A = E BA=E BA=E),则 B = A − 1 B=A^{-1} B=A1

∣ A ∣ ⋅ ∣ B ∣ = ∣ E ∣ = 1 |A|\cdot |B| =|E| = 1 AB=E=1,故 ∣ A ∣ ≠ 0 |A| \neq 0 A=0,因而 A − 1 A^{-1} A1存在,于是
B = E B = ( A − 1 A ) B = A − 1 ( A B ) = A − 1 E = A − 1 。 B = EB = (A^{-1}A)B = A^{-1}(AB) = A^{-1}E = A^{-1}。 B=EB=(A1A)B=A1(AB)=A1E=A1
方阵的逆阵满足下述运算规律:

  1. A A A可逆,则 A − 1 A^{-1} A1亦可逆,且 ( A − 1 ) − 1 = A (A^{-1})^{-1}=A (A1)1=A

  2. A A A可逆,数 λ ≠ 0 \lambda \neq 0 λ=0,则 λ A \lambda A λA可逆,且 ( λ A ) − 1 = 1 λ A − 1 (\lambda A)^{-1}= \frac{1}{\lambda}A^{-1} (λA)1=λ1A1

  3. A , B A,B A,B为同阶矩阵且均可逆,则 A B AB AB亦可逆,且
    ( A B ) − 1 = B − 1 A − 1 (AB)^{-1} = B^{-1}A^{-1} (AB)1=B1A1
    ( A B ) ( B − 1 A − 1 ) = A ( B B − 1 ) A − 1 = A A − 1 = E (AB)(B^{-1}A^{-1}) = A(BB^{-1})A^{-1}=AA^{-1} =E (AB)(B1A1)=A(BB1)A1=AA1=E ,即有 ( A B ) − 1 = B − 1 A − 1 (AB)^{-1}=B^{-1}A^{-1} (AB)1=B1A1

  4. A A A可逆,则 A T A^T AT亦可逆,且 ( A T ) − 1 = ( A − 1 ) T (A^T)^{-1}= (A^{-1})^T (AT)1=(A1)T

    A T ( A − 1 ) T = ( A − 1 A ) T = E T = E A^T(A^{-1})^T=(A^{-1}A)^T=E^T=E AT(A1)T=(A1A)T=ET=E

矩阵的秩

矩阵的初等变换

为了引进矩阵的初等变换,先来分析用消元法解线性方程组的例子。

引例 求解线性方程组

image-20210713135745673

image-20210713135801187

在上述消元过程中,始终把方程组看作一个整体。其中用到三种变换,即:交换方程次序(如 ( B 1 ) 中① ↔ ② (B_1)\text{中}①\leftrightarrow ② (B1));以不等于0的数乘某个方程(如 ( B 3 ) 中② × 1 2 (B_3)中②\times \frac{1}{2} (B3)×21);一个方程加上另一个方程的 k k k倍(如 ( B 2 ) 中③ − 2 ① (B_2)中③-2① (B2)2①)。

由于这三种变换都是可逆的,因此变换前的方程组与变换后的方程组是同解的。

在上述变换过程中,实际上只对方程组的系数和常数进行运算,未知数并未参与运算。因此,若记方程组 ( 1 ) (1) (1)的增广矩阵为
B = ( A , b ) = ( 2 − 1 − 1 1 2 1 1 − 2 1 4 4 − 6 2 − 2 4 3 6 − 9 7 9 ) , B =(A,b) =(21112112144622436979)

, B=(A,b)= 21431166122911272449 ,
那么上述对方程组的变换完全可以转换为对矩阵 B B B的变换。把方程组的上述三种同解变换移植到矩阵上,就得到句子的三种初等变换。

定义1 下面三种变换称为矩阵的初等行变换:

  1. 对调两行(对调 i , j i,j i,j两行,记作 r i ↔ r j r_i \leftrightarrow r_j rirj)
  2. 以数 k ≠ 0 k \neq0 k=0乘某一行中的所有元素(第 i i i行乘 k k k,记作 r i × k r_i \times k ri×k)
  3. 把某一行所有元素的 k k k倍加到另一行对应的元素上去(第 j j j行的 k k k倍加到第 i i i行上,记作 r i + k r j r_i+kr_j ri+krj)

把定义中的“行”换成“列”,即得矩阵的初等列变换的定义。

矩阵的初等行变换与初等列变换,统称为初等变换。

显然,三种初等变换都是可逆的(操作),且其逆变换是同一类型的初等变换;

  • 变换 r i ↔ r j r_i \leftrightarrow r_j rirj的逆变换就是其本身;
  • 变换 r i × k r_i \times k ri×k的逆变换为 r i × ( 1 k ) r_i \times \left(\frac{1}{k}\right) ri×(k1)(或记作 r i ÷ k r_i \div k ri÷k)
  • 变换 r i + k r j r_i + kr_j ri+krj的逆变换为 r i + ( − k ) r j r_i + (-k)r_j ri+(k)rj(或记作 r i − k r j r_i - kr_j rikrj)

如果矩阵 A A A经过有限次初等行变换变成矩阵 B B B,就称矩阵 A A A B B B行等价,记作 A ∼ r B A\overset{r}{\sim}B ArB

如果矩阵 A A A经过有限次初等列变换变成矩阵 B B B,就称矩阵 A A A B B B列等价,记作 A ∼ c B A\overset{c}{\sim}B AcB

如果矩阵 A A A经过有限次初等变换变成矩阵 B B B,就称为矩阵 A A A B B B等价,记作 A ∼ B A \sim B AB

矩阵之间的等价关系具有下列性质:

  1. 反身性 A ∼ A A \sim A AA
  2. 对称性 若 A ∼ B A \sim B AB,则 B ∼ A B \sim A BA
  3. 传递性 若 A ∼ B , B ∼ C A \sim B, B \sim C AB,BC,则 A ∼ C A \sim C AC

下面用矩阵的初等行变换来解方程组 ( 1 ) (1) (1),其过程可与方程组 ( 1 ) (1) (1)的消元过程一一对照。

image-20210713143030393

image-20210713143040851

image-20210713143056557

矩阵 B 4 B_4 B4 B 5 B_5 B5都称为行阶梯形矩阵,其特点是:

可画出一条阶梯线,线的下方全为0;

每个台阶只有一行,台阶数即使非零行的行数;

阶梯线的竖线后面的一个元素为非零元,也就是非零行的第一个非零元;

行阶梯形矩阵 B 5 B_5 B5还称为行最简形矩阵,其特点是:非零行的第一个非零元为 1 1 1,且这些非零元所在的列的其他元素都为 0 0 0

对于任何矩阵 A m × n A_{m \times n} Am×n,总可经过有限次初等行变换把它变为行阶梯形矩阵和行最简形矩阵。

对行最简形矩阵再施以初等列变换,可变成一种形状更简单的矩阵,称为标准形,例如:

image-20210713143608931

矩阵 F F F称为矩阵 B B B的标准形,其特点是: F F F的左上角是一个单位矩阵,其余元素全为 0 0 0

对于 m × n m \times n m×n矩阵 A A A,总可经过初等变换(行变换或列变换)把它化为标准形
F = ( E r O O O ) m × n F = (ErOOO)

_{m \times n} F=(ErOOO)m×n

此标准形由 m , n , r m,n,r m,n,r三个数完全确定,其中 r r r就是行阶梯形矩阵中非零行的行数。

定理1 A A A B B B m × n m \times n m×n矩阵,那么:

  1. A ∼ r B A \overset{r}{\sim} B ArB的充要条件是存在 m m m阶可逆矩阵 P P P;使 P A = B PA=B PA=B;
  2. A ∼ c B A \overset{c}{\sim} B AcB的充要条件是存在 n n n阶可逆矩阵 Q Q Q;使 A Q = B AQ=B AQ=B;
  3. A ∼ B A \sim B AB的充要条件是存在 m m m阶可逆矩阵 P P P n n n阶可逆矩阵 Q Q Q,使 P A Q = B PAQ=B PAQ=B

为了证明这个定理,我们引进初等矩阵的知识。

定义2 由单位阵 E E E经过一次初等变换得到的矩阵称为初等矩阵。

三种初等变换对应有三种初等矩阵。

(1) 把单位阵中第 i , j i,j i,j两行对调(或两列对调),得初等矩阵

image-20210713151049997

m m m阶初等矩阵 E m ( i , j ) E_m(i,j) Em(i,j)左乘矩阵 A = ( a i j ) m × n A=(a_{ij})_{m \times n} A=(aij)m×n,得

image-20210713151314992

其结果相当于对矩阵 A A A施行第一种初等行变换。

∣ E ( i , j ) ∣ = − 1 ≠ 0 |E(i,j)| = -1 \neq 0 E(i,j)=1=0,所以是可逆的。因为 ∣ E ∣ = 1 |E|=1 E=1,对 E E E交换两行或两列,行列式变号。

(2)以数 k ≠ 0 k \neq 0 k=0乘单位阵的第 i i i行(或第 i i i列),得初等矩阵

image-20210713151532486

可以验知:以 E m ( i ( k ) ) E_m(i(k)) Em(i(k))左乘矩阵 A A A,其结果相当于以数 k k k A A A的第 i i i ( r i × k ) (r_i \times k) (ri×k)

行列式某行乘以某个数 k k k,等于用 k k k乘以此行列式,所以行列式不为零,可逆。

或因此矩阵是对角矩阵,行列式为 1 × 1 ⋯ × k ⋯ × 1 = k 1 \times 1 \cdots \times k \cdots \times 1 = k 1×1×k×1=k

(3) 以 k k k E E E的第 j j j行加到第 i i i行上或以 k k k E E E的第 i i i列加到第 j j j列上,得初等矩阵

image-20210713151729864

可以验知:以 E m ( i j ( k ) ) E_m(ij(k)) Em(ij(k))左乘矩阵 A A A,其结果相当于把 A A A的第 j j j行乘 k k k加到第 i i i ( r i + k r j ) (r_i+kr_j) (ri+krj)

得到的矩阵的行列式还是为 1 ≠ 0 1 \neq 0 1=0,所以可逆。

归纳上面的讨论,可得

性质1 A A A是一个 m × n m \times n m×n矩阵,对 A A A施行一次初等行变换,相当于在 A A A的左边乘以相应的 m m m阶初等矩阵;对 A A A施行一次初等列变换,相当于在 A A A的右边乘以相应的 n n n阶初等矩阵。

性质2 方阵 A A A可逆的充要条件是存在有限个初等矩阵 P 1 , P 2 , ⋯   , P l P_1,P_2,\cdots,P_l P1,P2,,Pl,使 A = P 1 P 2 ⋯ P l A = P_1P_2\cdots P_l A=P1P2Pl

先证充分性。设 A = P 1 P 2 ⋯ P l A = P_1P_2\cdots P_l A=P1P2Pl,因初等矩阵可逆,有限个可逆矩阵的乘积仍可逆,故 A A A可逆。

再证必要性 设 n n n阶方阵 A A A可逆,且 A A A的标准形矩阵为 F F F,由于 F ∼ A F \sim A FA,知 F F F经过有限次初等变换可化为 A A A,即有初等矩阵 P 1 , P 2 , ⋯   , P l P_1,P_2,\cdots,P_l P1,P2,,Pl,使
A = P 1 ⋯ P s F P s + 1 ⋯ P l , A = P_1 \cdots P_s FP_{s+1}\cdots P_l, A=P1PsFPs+1Pl,
因为 A A A可逆,所以 ∣ A ∣ = ∣ P 1 ∣ ⋅ ∣ P 2 ∣ ⋅ ⋯ ∣ P l ∣ ≠ 0 |A| = |P_1|\cdot |P_2| \cdot \cdots |P_l| \neq 0 A=P1P2Pl=0,所以 ∣ P 1 ∣ , ∣ P 2 ∣ , ⋯   , ∣ P l ∣ |P_1| ,|P_2|,\cdots,|P_l| P1,P2,,Pl都不等于零。

所以 P 1 , ⋯   , P l P_1,\cdots,P_l P1,,Pl也都可逆,故标准形矩阵 F F F可逆。假设
F = ( E r O O O ) n × n F = (ErOOO)

_{n \times n} F=(ErOOO)n×n
中的$ r < n ,则 ,则 ,则|F| =0 ,与 ,与 ,与F 可逆矛盾,因此必有 可逆矛盾,因此必有 可逆矛盾,因此必有r=n ,即 ,即 ,即F=E$,从而
A = P 1 P 2 ⋯ P l . A=P_1P_2\cdots P_l. A=P1P2Pl.

下面应用初等矩阵的知识来证明定理1。

定理1的证明

  1. 依据 A ∼ r B A\overset{r}{\sim}B ArB的定义和初等矩阵的性质,有
    A ∼ r B ⇔ A 经过有限次初等行变换变成 B ⇔ 存在有限个 m 阶初等矩阵 P 1 , P 2 , ⋯   , P l ,使 P l ⋯ P 2 P 1 A = B ⇔ 存在 m 阶可逆矩阵 P ,使 P A = B . ArBABmP1,P2,,Pl使PlP2P1A=BmP使PA=B.
    ArBA经过有限次初等行变换变成B存在有限个m阶初等矩阵P1,P2,,Pl,使PlP2P1A=B存在m阶可逆矩阵P,使PA=B.

类似可证明2. 3.

推论 方阵 A A A可逆的充分必要条件是 A ∼ r E A\overset{r}{\sim}E ArE

A A A可逆 ⇔ \Leftrightarrow 存可逆阵 P P P(即 A A A的逆阵),使 P A = E PA=E PA=E,所以 A ∼ r E A\overset{r}{\sim}E ArE

定理1表明,如果 A ∼ r B A\overset{r}{\sim}B ArB,即 A A A经过一系列初等变换可以变为 B B B,则有可逆矩阵 P P P,使 P A = B PA=B PA=B。那么,如何求出这个可逆矩阵 P P P

由于
P A = B ⇔ { P A = B , P E = P ⇔ P ( A , E ) = ( B , P ) ⇔ ( A , E ) ∼ r ( B , P ) PA=B \Leftrightarrow {PA=B,PE=P

\Leftrightarrow P(A,E) = (B,P) \Leftrightarrow (A,E) \overset{r}{\sim} (B,P) PA=B{PA=B,PE=PP(A,E)=(B,P)(A,E)r(B,P)
因此,如果对矩阵 ( A , E ) (A,E) (A,E)作初等行变换,那么,当把 A A A变为 B B B时, E E E就变为 P P P

于是就得到了求逆矩阵的一种新方法。

矩阵的秩

定义 m × n m \times n m×n的矩阵 A A A中,任取 k k k行与 k k k列,位于这些行列交叉处的 k 2 k^2 k2个元素,不改变它们在 A A A中所处的位置次序而得的 k k k阶行列式,称为矩阵 A A A k k k阶子式。

m × n m \times n m×n矩阵 A A A k k k阶子式共有 C m k ⋅ C n k C_m^k \cdot C_n^k CmkCnk个。

定义 设在矩阵 A A A中有一个不等于0的 r r r阶子式 D D D,且所有 r + 1 r+1 r+1阶子式(如果存在的话)全等于0,那么 D D D称为矩阵 A A A的最高阶非零子式,数 r r r称为矩阵 A A A的秩,记作 R ( A ) R(A) R(A)。并规定零矩阵的秩等于0。

比如,我们上面知道,一个 m × n m \times n m×n矩阵 A A A,它的标准形
( E r O O O ) m × n (ErOOO)

_{m \times n} (ErOOO)m×n
由数 r r r完全确定,这个数就是 A A A的行阶梯形中非零行的行数,也就是矩阵 A A A的秩。

显然,若 A A A m × n m \times n m×n矩阵,则 0 ≤ R ( A ) ≤ min ⁡ { m , n } 0 \leq R(A) \leq \min\{m,n\} 0R(A)min{m,n}

由于行列式与其转置行列式相等,因此 A T A^T AT的子式与 A A A的子式对应相等,从而 R ( A T ) = R ( A ) R(A^T) = R(A) R(AT)=R(A)

对于 n n n阶矩阵 A A A,由于 A A A n n n阶子式只有一个 ∣ A ∣ |A| A,故当 ∣ A ∣ ≠ 0 |A| \neq 0 A=0 R ( A ) = n R(A)=n R(A)=n
∣ A ∣ = 0 |A| =0 A=0 R ( A ) < n R(A) < n R(A)<n

可见可逆矩阵的秩等于矩阵的阶数,不可逆矩阵的秩小于矩阵的阶数。因此,可逆矩阵又称为满秩矩阵,不可逆矩阵(奇异矩阵)又称为降秩矩阵。

定理2 A ∼ B A \sim B AB,则 R ( A ) = R ( B ) R(A) = R(B) R(A)=R(B)
推论 若可逆矩阵 P , Q P,Q P,Q使 P A Q = B PAQ = B PAQ=B,则 R ( A ) = R ( B ) R(A) = R(B) R(A)=R(B)

秩的性质

  1. 0 ≤ R ( A m × n ) ≤ min ⁡ ∣ m , n ∣ 0 \leq R(A_{m \times n}) \leq \min |m,n| 0R(Am×n)minm,n
  2. R ( A T ) = R ( A ) R(A^T) = R(A) R(AT)=R(A)
  3. A ∼ B A \sim B AB,则 R ( A ) = R ( B ) R(A) = R(B) R(A)=R(B)
  4. P P P Q Q Q可逆,则 R ( P A Q ) = R ( A ) R(PAQ) = R(A) R(PAQ)=R(A)
  5. max ⁡ { R ( A ) , R ( B ) } ≤ R ( A , B ) ≤ R ( A ) + R ( B ) \max \{R(A),R(B)\} \leq R(A,B) \leq R(A) + R(B) max{R(A),R(B)}R(A,B)R(A)+R(B)
    • 特别第,当 B = b B=b B=b为非零列向量时,有
      R ( A ) ≤ R ( A , b ) ≤ R ( A ) + 1 R(A) \leq R(A,b) \leq R(A) +1 R(A)R(A,b)R(A)+1
  6. R ( A + B ) ≤ R ( A ) + R ( B ) R(A+B) \leq R(A) + R(B) R(A+B)R(A)+R(B)
  7. R ( A B ) ≤ min ⁡ { R ( A ) , R ( B ) } R(AB) \leq \min \{R(A),R(B) \} R(AB)min{R(A),R(B)}
  8. A m × n B n × l = O A_{m \times n}B_{n \times l} = O Am×nBn×l=O,则 R ( A ) + R ( B ) ≤ n R(A) + R(B) \leq n R(A)+R(B)n

线性方程组的解

设有 n n n个未知数 m m m个方程的线性方程组
{ a 11 x 1 + a 12 x 2 + ⋯ + a 1 n x n = b 1 , a 21 x 1 + a 22 x 2 + ⋯ + a 2 n x n = b 2 , ⋯ a m 1 x 1 + a m 2 x 2 + ⋯ + a m n x n = b m , (3) {a11x1+a12x2++a1nxn=b1,a21x1+a22x2++a2nxn=b2,am1x1+am2x2++amnxn=bm,

\tag{3} a11x1+a12x2++a1nxn=b1,a21x1+a22x2++a2nxn=b2,am1x1+am2x2++amnxn=bm,(3)

( 3 ) (3) (3)式可以写成以向量 x x x为未知元的向量方程
A x = b , Ax = b, Ax=b,

定理3 n n n元线性方程组 A x = b Ax=b Ax=b

  1. 无解的充分必要条件是 R ( A ) < R ( A , b ) R(A) < R(A,b) R(A)<R(A,b) (即出现了 0 = b 0 = b 0=b的情况,其中 b ≠ 0 b \neq 0 b=0)
  2. 有唯一解的充分必要条件是 R ( A ) = R ( A , b ) = n R(A) = R(A,b) = n R(A)=R(A,b)=n
  3. 有无限多解的充分必要条件是 R ( A ) = R ( A , b ) < n R(A) = R(A,b) < n R(A)=R(A,b)<n

这里的 n n n是未知数的个数。

定理4 n n n元齐次线性方程组 A x = 0 Ax =0 Ax=0有非零解的充分必要条件是 R ( A ) < n R(A) < n R(A)<n
定理5 线性方程组 A x = b Ax =b Ax=b有解的充分必要条件是 R ( A ) = R ( A , b ) R(A) = R(A,b) R(A)=R(A,b)

用克拉默法则来看的话,
如果 A A A是方阵, A x = 0 Ax=0 Ax=0有非零解的条件是, ∣ A ∣ = 0 |A| =0 A=0,即 R ( A ) < n R(A) < n R(A)<n

我们知道
逆矩阵存在 ⇔ ∣ A ∣ ≠ 0 ⇔ R ( A ) = n \Leftrightarrow |A| \neq 0 \Leftrightarrow R(A) =n A=0R(A)=n

正交性

标量积

两个 R n R^n Rn中的向量 x x x y y y可以看成是 n × 1 n \times 1 n×1矩阵。构造矩阵乘积 x T y x^Ty xTy。这个乘积为一个 1 × 1 1\times 1 1×1矩阵,可看成是一个 R 1 R^1 R1中的向量,或一个实数(标量)。

乘积 x T y x^Ty xTy称为 x x x y y y的标量积(scalar product)或内积。

x T y = ∣ ∣ x ∣ ∣    ∣ ∣ y ∣ ∣   c o s θ = ∑ i = 1 n x i y i = ⟨ x , y ⟩ x^Ty = ||x||\,\, ||y|| \, cos \theta = \sum_{i=1}^n x_i y_i = \langle x,y \rangle xTy=∣∣x∣∣∣∣y∣∣cosθ=i=1nxiyi=x,y
如果 x T y = 0 x^Ty=0 xTy=0,则称向量 x x x y y y为正交的。

内积空间

一个向量空间 V V V上的内积为 V V V上的运算,它将 V V V中的向量 x x x y y y与一个实数 ⟨ x , y ⟩ \langle x,y \rangle x,y关联,并满足下列条件:

  1. ⟨ x , y ⟩ ≥ 0 \langle x,y \rangle \geq 0 x,y0,等号成立的充要条件是 x = 0 x=0 x=0
  2. V V V中所有的 x x x y y y,有 ⟨ x , y ⟩ = ⟨ y , x ⟩ \langle x,y \rangle = \langle y,x \rangle x,y=y,x
  3. V V V中所有的 x , y , z x,y,z x,y,z及所有的标量 α , β \alpha,\beta α,β,有 ⟨ α x + β y , z ⟩ = α ⟨ x , z ⟩ + β ⟨ y , z ⟩ \langle \alpha x + \beta y,z \rangle = \alpha \langle x,z \rangle + \beta \langle y,z \rangle αx+βy,z=αx,z+βy,z

一个定义了内积的向量空间 V V V称为内积空间。

正交集

定义 v 1 , v 2 , ⋯   , v n v_1,v_2,\cdots,v_n v1,v2,,vn为一内积空间 V V V中的非零向量。若 i ≠ j i \neq j i=j时有 ⟨ v i , v j ⟩ = 0 \langle v_i, v_j \rangle = 0 vi,vj=0,则 { v 1 , v 2 , ⋯   , v n } \{v_1,v_2,\cdots,v_n\} {v1,v2,,vn}称为向量的正交集

定理 ⟨ v i , v j ⟩ = 0 \langle v_i, v_j \rangle = 0 vi,vj=0,则 { v 1 , v 2 , ⋯   , v n } \{v_1,v_2,\cdots,v_n\} {v1,v2,,vn}为一内积空间 V V V中非零向量的正交集,则 v 1 , v 2 , ⋯   , v n v_1,v_2,\cdots,v_n v1,v2,,vn是线性无关的。

规范正交

定义 规范正交的向量集合是单位向量的正交集。

集合 { u 1 , u 2 , ⋯   , u n } \{u_1,u_2,\cdots, u_n\} {u1,u2,,un}是规范正交集的充要条件为
⟨ u i , u j ⟩ = δ i j \langle u_i, u_j \rangle = \delta_{ij} ui,uj=δij
其中
δ i j = { 1 当    i = j 0 当    i ≠ j \delta_{ij} = \left\{ 1i=j0ij

\right. δij={10i=ji=j

说的是集合中任意两个向量做内积结果为 0 0 0

规范正交基

B = { u 1 , u 2 , ⋯   , u k } B=\{u_1,u_2,\cdots, u_k\} B={u1,u2,,uk}为一个内积空间 V V V中的规范正交集,则 B B B为子空间 S = Span ( u 1 , u 2 , ⋯   , u k ) S=\text{Span}(u_1,u_2,\cdots, u_k) S=Span(u1,u2,,uk)的一组基。我们称 B B B S S S的一组规范正交基

正交矩阵

定义 若一个 n × n n \times n n×n矩阵 Q Q Q的列向量构成 R n R^n Rn中的一组规范正交基,则称 Q Q Q正交矩阵

定理 一个 n × n n \times n n×n矩阵 Q Q Q是正交矩阵的充要条件为 Q T Q = I Q^TQ=I QTQ=I
由定理可得,若 Q Q Q为一正交矩阵,则 Q Q Q可逆,且 Q − 1 = Q T Q^{-1}=Q^T Q1=QT

性质 Q Q Q为一个 n × n n \times n n×n的正交矩阵,则:

  1. Q Q Q的列向量构成了 R n R^n Rn的一组规范正交基
  2. Q T Q = I Q^TQ=I QTQ=I
  3. Q T = Q − 1 Q^T=Q^{-1} QT=Q1
  4. ⟨ Q x , Q y ⟩ = ⟨ x , y ⟩ \langle Qx, Qy \rangle = \langle x, y \rangle Qx,Qy=x,y
  5. ∣ ∣ Q x ∣ ∣ 2 = ∣ ∣ x ∣ ∣ 2 ||Qx||_2 = ||x||_2 ∣∣Qx2=∣∣x2

相似矩阵

正定矩阵与半正定矩阵

定义1 给定一个大小为 n × n n \times n n×n的实对称矩阵 A A A,若对于任意长度为 n n n的非零向量 x x x,有 x T A x > 0 x^TAx > 0 xTAx>0恒成立,则矩阵 A A A是一个正定矩阵

定义2 给定一个大小为 n × n n \times n n×n的实对称矩阵 A A A,若对于任意长度为 n n n的非零向量 x x x,有 x T A x ≥ 0 x^TAx \geq 0 xTAx0恒成立,则矩阵 A A A是一个半正定矩阵

向量的内积

定义1 设有 n n n为向量

x = ( x 1 x 2 ⋮ x n ) ,   y = ( y 1 y 2 ⋮ y n ) x = (x1x2xn)

, \, y=(y1y2yn)
x= x1x2xn ,y= y1y2yn


[ x , y ] = x 1 y 1 + x 2 y 2 + ⋯ x n y n , [x,y] =x_1y_1 + x_2y_2 + \cdots x_ny_n, [x,y]=x1y1+x2y2+xnyn,
[ x , y ] [x,y] [x,y]称为向量 x x x y y y的内积(内积也叫点积,也可表示为 ⟨ x , y ⟩ \langle x,y \rangle x,y)。

内积是两个向量之间的一种运算,其结果是一个实数,用矩阵记号表示,当 x x x y y y都是列向量时,有
[ x , y ] = x T y = y T x [x,y] = x^Ty = y^T x [x,y]=xTy=yTx

内积具有下列性质(其中 x , y , z x,y,z x,y,z n n n维向量, λ \lambda λ为实数):

  1. [ x , y ] = [ y , x ] [x,y] = [y,x] [x,y]=[y,x]
  2. [ λ x , y ] = λ [ x , y ] [\lambda x,y] = \lambda[x,y] [λx,y]=λ[x,y]
  3. [ x + y , z ] = [ x , z ] + [ y , z ] [x+y,z] = [x,z] + [y,z] [x+y,z]=[x,z]+[y,z]
  4. x = 0 x=0 x=0时, [ x , x ] = 0 [x,x]=0 [x,x]=0;当 x ≠ 0 x \neq 0 x=0时, [ x , x ] > 0 [x,x] >0 [x,x]>0

可以得到柯西不等式
[ x , y ] 2 ≤ [ x , x ] [ y , y ] [x,y]^2 \leq [x,x][y,y] [x,y]2[x,x][y,y]

定义2
∣ ∣ x ∣ ∣ = [ x , ] = x 1 2 + x 2 2 + ⋯ + x n 2 ||x|| =\sqrt{[x,]} = \sqrt{x_1^2 + x_2^2 + \cdots + x_n^2} ∣∣x∣∣=[x,] =x12+x22++xn2
∣ ∣ x ∣ ∣ ||x|| ∣∣x∣∣称为 n n n维向量 x x x的长度(或范数)。

∣ ∣ x ∣ ∣ = 1 ||x|| =1 ∣∣x∣∣=1时,称 x x x为单位向量。

向量的长度具有以下性质:

  1. 非负性 当 x ≠ 0 x \neq 0 x=0时, ∣ ∣ x ∣ ∣ > 0 ||x|| >0 ∣∣x∣∣>0;当 x = 0 x =0 x=0时, ∣ ∣ x ∣ ∣ = 0 ||x|| =0 ∣∣x∣∣=0
  2. 齐次性 ∣ ∣ λ x ∣ ∣ = ∣ λ ∣ ∣ ∣ x ∣ ∣ ||\lambda x|| = |\lambda| ||x|| ∣∣λx∣∣=λ∣∣∣x∣∣
  3. 三角不等式 ∣ ∣ x + y ∣ ∣ ≤ ∣ ∣ x ∣ ∣ + ∣ ∣ y ∣ ∣ ||x+y|| \leq ||x|| +||y|| ∣∣x+y∣∣∣∣x∣∣+∣∣y∣∣

[ x , y ] = 0 [x,y]=0 [x,y]=0时,称向量 x x x y y y正交。显然,若 x = 0 x=0 x=0,则 x x x与任何向量都正交。

定理1 n n n维向量 a 1 , a 2 , ⋯   , a r a_1,a_2,\cdots, a_r a1,a2,,ar是一组两两正交的非零向量,则 a 1 , a 2 , ⋯   , a r a_1,a_2,\cdots, a_r a1,a2,,ar线性无关。

若向量 a 1 , a 2 , a 3 a_1,a_2,a_3 a1,a2,a3线性无关,则它们互相不能用其他向量线性表示。

设有 λ 1 , λ 2 , ⋯   , λ r \lambda_1,\lambda_2,\cdots,\lambda_r λ1,λ2,,λr使
λ 1 a 1 + λ 1 a 2 + ⋯ + λ r a r = 0 , \lambda_1a_1 + \lambda_1a_2 + \cdots + \lambda_ra_r = 0, λ1a1+λ1a2++λrar=0,
我们要证明 λ 1 = λ 2 = ⋯ λ r = 0 \lambda_1 =\lambda_2 = \cdots \lambda_r = 0 λ1=λ2=λr=0。以 a 1 T a_1^T a1T左乘上式两端,当 i ≥ 2 i \geq 2 i2时, a 1 T a i = 0 a_1^T a_i =0 a1Tai=0,要使上式等于零,所以
λ 1 a 1 T a 1 = 0 \lambda_1 a_1^T a_1 = 0 λ1a1Ta1=0
因为 a 1 ≠ 0 a_1 \neq 0 a1=0,所以 a 1 T a 1 ≠ 0 a_1^T a_1 \neq 0 a1Ta1=0,从而只能 λ 1 = 0 \lambda_1=0 λ1=0,类似可以证明 λ 2 = 0 , ⋯   , λ r = 0 \lambda_2 =0,\cdots, \lambda_r =0 λ2=0,,λr=0

于是向量组 a 1 , a 2 , ⋯   , a r a_1,a_2,\cdots, a_r a1,a2,,ar线性无关。

定义3 n n n维向量 e 1 , e 2 , ⋯   , e r e_1,e_2,\cdots,e_r e1,e2,,er是向量空间 V V V的一个基,如果 e 1 , e 2 , ⋯   , e r e_1,e_2,\cdots,e_r e1,e2,,er两两正交,且都是单位向量,则称 e 1 , e 2 , ⋯   , e r e_1,e_2,\cdots,e_r e1,e2,,er V V V的一个规范正交基。

e 1 , e 2 , ⋯   , e r e_1,e_2,\cdots,e_r e1,e2,,er V V V的一个规范正交基,那么 V V V中任意向量 a a a都能由 e 1 , e 2 , ⋯   , e r e_1,e_2,\cdots,e_r e1,e2,,er线性表示,设表示为

a = λ 1 e 1 + λ 2 e 2 + ⋯ + λ r e r a = \lambda_1 e_1 + \lambda_ 2e_2 + \cdots + \lambda_r e_r a=λ1e1+λ2e2++λrer

定义4 如果 n n n阶矩阵 A A A满足
A T A = E ( 即 A − 1 = A T ) A^TA = E \qquad (\text{即}A^{-1}=A^T) ATA=E(A1=AT)
那么称 A A A为正交矩阵,简称正交阵。

A T A = E ⇒ ∣ A T ∣ ∣ A ∣ = 1 ⇒ A 可逆 ⇒ A − 1 = A T A^TA=E \Rightarrow |A^T||A|=1 \Rightarrow A\text{可逆} \Rightarrow A^{-1}=A^T ATA=EAT∣∣A=1A可逆A1=AT

上式用 A A A的列向量表示,即是
( a 1 T a 2 T ⋮ a n T ) ( a 1 , a 2 , ⋯   , a n ) = E , (aT1aT2aTn)

(a_1,a_2,\cdots, a_n) =E, a1Ta2TanT (a1,a2,,an)=E,
因为 A T A = E A^TA=E ATA=E A A T = E AA^T=E AAT=E等价,所以上述结论对 A A A的行向量亦成立。

由此可见, n n n阶正交阵 A A A n n n个列(行)向量构成向量空间 R n R^n Rn的一个规范正交基。

方阵的特征值与特征向量

定义6 A A A n n n阶矩阵,如果数 λ \lambda λ n n n维非零列向量 x x x使关系式
A x = λ x (1) Ax =\lambda x \tag{1} Ax=λx(1)
成立,那么,这样的数 λ \lambda λ称为矩阵 A A A的特征值,非零向量 x x x称为 A A A的对应于特征值 λ \lambda λ的特征向量。

( 1 ) (1) (1)式也可以写成
( A − λ E ) x = 0 (A - \lambda E)x = 0 (AλE)x=0
这是 n n n个未知数 n n n个方程的齐次线性方程组,它有非零解的充分必要条件是系数行列式
∣ A − λ E ∣ = 0 , |A - \lambda E| = 0, AλE=0,

∣ a 11 − λ a 12 ⋯ a 1 n a 21 a 22 − λ ⋯ a 2 n ⋮ ⋮ ⋮ a n 1 a n 2 ⋯ a n n − λ ∣ = 0 |a11λa12a1na21a22λa2nan1an2annλ|

= 0 a11λa21an1a12a22λan2a1na2nannλ =0

R ( A ) = R ( A , b ) < n R(A) = R(A,b) < n R(A)=R(A,b)<n 无穷解

上式是以 λ \lambda λ为未知数的一元 n n n次方程,称为矩阵 A A A的特征方程。其左端 ∣ A − λ E ∣ |A - \lambda E| AλE λ \lambda λ n n n次多项式,记作 f ( λ ) f(\lambda) f(λ),称为矩阵 A A A的特征多项式。

n n n阶矩阵 A = ( a i j ) A = (a_{ij}) A=(aij)的特征值为 λ 1 , λ 2 , ⋯   , λ n \lambda_1,\lambda_2,\cdots, \lambda_n λ1,λ2,,λn,有以下性质:

  1. λ 1 + λ 2 + ⋯ + λ n = a 11 + a 22 + ⋯ + a n n \lambda_1 + \lambda_2 +\cdots + \lambda_n = a_{11} + a_{22} + \cdots +a_{nn} λ1+λ2++λn=a11+a22++ann
  2. λ 1 λ 2 ⋯ λ n = ∣ A ∣ \lambda_1\lambda_2 \cdots \lambda_n =|A| λ1λ2λn=A

λ = λ i \lambda = \lambda_i λ=λi为矩阵 A A A的一个特征值,则由方程
( A − λ i E ) x = 0 (A - \lambda_iE)x = 0 (AλiE)x=0
可求得非零解 x = p i x = p_i x=pi,那么 p i p_i pi便是 A A A的对应于特征值 λ i \lambda_i λi的特征向量。

λ \lambda λ是方阵 A A A的特征值,证明

  1. λ 2 \lambda^2 λ2 A 2 A^2 A2的特征值
  2. A A A可逆时, 1 λ \frac{1}{\lambda} λ1 A − 1 A^{-1} A1的特征值。

λ \lambda λ A A A的特征值,故有 x ≠ 0 x \neq 0 x=0使 A x = λ x Ax= \lambda x Ax=λx。于是
(1) A 2 x = A ( A x ) = A ( λ x ) = λ ( A x ) = λ 2 x A^2 x = A(Ax) = A(\lambda x) = \lambda(A x) = \lambda^2 x A2x=A(Ax)=A(λx)=λ(Ax)=λ2x,
所以 λ 2 \lambda^2 λ2 A 2 A^2 A2的特征值。
依此类推,不难证明:若 λ \lambda λ A A A的特征值,则 λ k \lambda^k λk A k A^k Ak的特征值。
(2) 当 A A A可逆时,由 A x = λ x A x = \lambda x Ax=λx,有 x = λ A − 1 x x = \lambda A^{-1} x x=λA1x,因 x ≠ 0 x \neq 0 x=0,知 λ ≠ 0 \lambda \neq 0 λ=0,故
A − 1 x = 1 λ x , A^{-1} x = \frac{1}{\lambda} x, A1x=λ1x
所以 1 λ \frac{1}{\lambda} λ1 A − 1 A^{-1} A1的特征值。

定理2 λ 1 , λ 2 , ⋯   , λ m \lambda_1,\lambda_2,\cdots, \lambda_m λ1,λ2,,λm是方阵 A A A m m m个特征值, p 1 , p 2 , ⋯   , p m p_1,p_2,\cdots, p_m p1,p2,,pm依次是与之对应的特征向量,如果 λ 1 , λ 2 , ⋯   , λ m \lambda_1,\lambda_2,\cdots, \lambda_m λ1,λ2,,λm各不相等,则 p 1 , p 2 , ⋯   , p m p_1,p_2,\cdots, p_m p1,p2,,pm线性无关。

相似矩阵

定义7 A , B A,B A,B都是 n n n阶矩阵,若有可逆矩阵 P P P,使
P − 1 A P = B P^{-1}AP = B P1AP=B
则称 B B B A A A的相似矩阵,或说矩阵 A A A B B B相似。对 A A A进行运算 P − 1 A P^{-1}A P1A称为对 A A A进行相似变换。可逆矩阵 P P P称为把 A A A变成 B B B的相似变换矩阵。

定理3 n n n阶矩阵 A A A B B B相似,则 A A A B B B的特征多项式相同,从而 A A A B B B的特征值亦相同。
A A A B B B相似,即有可逆矩阵 P P P,使 P − 1 A P = B P^{-1}AP=B P1AP=B,故
∣ B − λ E ∣ = ∣ P − 1 A P − λ P − 1 P ∣ = ∣ P − 1 ( A − λ E ) P ∣ = ∣ P − 1 ∣ ⋅ ∣ A − λ E ∣ ⋅ ∣ P ∣ = ∣ A − λ E ∣ |BλE|=|P1APλP1P|=|P1(AλE)P|=|P1||AλE||P|=|AλE|

BλE=P1APλP1P=P1(AλE)P=P1AλEP=AλE

推论 n n n阶矩阵 A A A与对角阵
Λ = [ λ 1 λ 2 ⋱ λ n ] \Lambda= [λ1λ2λn]

Λ= λ1λ2λn
相似,则 λ 1 , λ 2 , ⋯   , λ n \lambda_1,\lambda_2,\cdots,\lambda_n λ1,λ2,,λn即是 A A A n n n个特征值。

下面我们要讨论的主要问题是:对 n n n阶矩阵 A A A,寻求相似变换矩阵 P P P,使 P − 1 A P = Λ P^{-1}AP = \Lambda P1AP=Λ为对角阵,这就称为把矩阵 A A A对角化。

假设已经找到可逆矩阵 P P P,使 P − 1 A P = Λ P^{-1}AP=\Lambda P1AP=Λ为对角阵,我们来讨论 P P P应满足什么关系。

P P P用其列向量表示为
P = ( p 1 , p 2 , ⋯   , p n ) , P=(p_1,p_2,\cdots,p_n), P=(p1,p2,,pn),
P − 1 A P = Λ P^{-1}AP=\Lambda P1AP=Λ,得 A P = P Λ AP=P\Lambda AP=PΛ,即
A ( p 1 , p 2 , ⋯   , p n ) = ( p 1 , p 2 , ⋯   , p n ) [ λ 1 λ 2 ⋱ λ n ] = ( λ 1 p 1 , λ 2 p 2 , ⋯   , λ n p n ) , A(p1,p2,,pn)=(p1,p2,,pn)[λ1λ2λn]=(λ1p1,λ2p2,,λnpn),

A(p1,p2,,pn)=(p1,p2,,pn) λ1λ2λn =(λ1p1,λ2p2,,λnpn),
于是有
A p i = λ i p i ( i = 1 , 2 , ⋯   , n ) . Ap_i = \lambda_ip_i\qquad(i=1,2,\cdots,n). Api=λipi(i=1,2,,n).
可见 λ i \lambda_i λi A A A的特征值,而 P P P的列向量 p i p_i pi就是 A A A的对应于特征值 λ i \lambda_i λi的特征向量。

定理4 n n n阶矩阵 A A A与对角阵相似(即 A A A能对角化)的充分必要条件是 A A A n n n个线性无关的特征向量。

联系定理2,得

对称矩阵的对角化

定理5 对称阵的特征值为实数

设复数 λ \lambda λ为对称阵 A A A的特征值,复向量 x x x为对应的特征向量,即 A x = λ x , x ≠ 0 Ax=\lambda x,x \neq 0 Ax=λx,x=0

λ ‾ \overline{\lambda} λ表示 λ \lambda λ的共轭复数, x ‾ \overline{x} x表示 x x x的共轭复向量,而 A A A为实矩阵,有 A = A ‾ A = \overline{A} A=A,故

A x ‾ = A ‾ x ‾ = ( A x ‾ ) = ( λ x ‾ ) = λ ‾ x ‾ A\overline{x} = \overline{A}\overline{x} = (\overline{Ax}) = (\overline{\lambda x}) = \overline{\lambda}\overline{x} Ax=Ax=(Ax)=(λx)=λx。于是有
x ‾ T A x = x ‾ T ( A x ) = x ‾ T λ x = λ x ‾ T x , \overline{x}^TAx = \overline{x}^T(Ax)=\overline{x}^T \lambda x=\lambda \overline{x}^T x, xTAx=xT(Ax)=xTλx=λxTx,


x ‾ T A x = ( x ‾ T A T ) x = ( A x ‾ ) T x = ( λ ‾ x ‾ ) T x = λ ‾ x ‾ T x , \overline{x}^TAx = (\overline{x}^TA^T)x=(A\overline{x})^Tx=(\overline{\lambda}\overline{x})^Tx=\overline{\lambda}\overline{x}^Tx, xTAx=(xTAT)x=(Ax)Tx=(λx)Tx=λxTx,
两式相减,得
( λ − λ ‾ ) x ‾ T x = 0 , (\lambda - \overline{\lambda})\overline{x}^Tx = 0, (λλ)xTx=0,
x ≠ 0 x \neq 0 x=0,所以
x ‾ T x = ∑ i = 1 x ‾ i x i = ∑ i = 1 ∣ x i ∣ 2 ≠ 0 , \overline{x}^Tx=\sum_{i=1}\overline{x}_i x_i = \sum_{i=1} |x_i|^2 \neq 0, xTx=i=1xixi=i=1xi2=0,
λ − λ ‾ = 0 \lambda -\overline{\lambda} =0 λλ=0,即 λ = λ ‾ \lambda = \overline{\lambda} λ=λ,说明 λ \lambda λ是实数。

定理6 λ 1 , λ 2 \lambda_1,\lambda_2 λ1,λ2是对称阵 A A A的两个特征值, p 1 , p 2 p_1,p_2 p1,p2是对应的特征向量。若 λ 1 ≠ λ 2 \lambda_1 \neq \lambda_2 λ1=λ2,则 p 1 , p 2 p_1,p_2 p1,p2正交。

λ 1 p 1 = A p 1 , λ 2 p 2 = A p 2 , λ 1 ≠ λ 2 \lambda_1p_1 = Ap_1,\lambda_2p_2 = Ap_2,\lambda_1 \neq \lambda_2 λ1p1=Ap1,λ2p2=Ap2,λ1=λ2

A A A对称,故 λ 1 p 1 T = ( λ 1 p 1 ) T = ( A p 1 ) T = p 1 T A T = p 1 T A \lambda_1p_1^T=(\lambda_1p_1)^T=(Ap_1)^T=p_1^TA^T=p_1^TA λ1p1T=(λ1p1)T=(Ap1)T=p1TAT=p1TA,于是
λ 1 p 1 T p 2 = p 1 T A p 2 = p 1 T ( λ 2 p 2 ) = λ 2 p 1 T p 2 , \lambda_1p_1^Tp_2 = p_1^TAp_2=p_1^T(\lambda_2p_2)=\lambda_2p_1^Tp_2, λ1p1Tp2=p1TAp2=p1T(λ2p2)=λ2p1Tp2,

( λ 1 − λ 2 ) p 1 T p 2 = 0. (\lambda_1 -\lambda_2)p_1^Tp_2 = 0. (λ1λ2)p1Tp2=0.
因为 λ 1 ≠ λ 2 \lambda_1 \neq \lambda_2 λ1=λ2,故 p 1 T p 2 = 0 p_1^Tp_2=0 p1Tp2=0,即 p 1 , p 2 p_1,p_2 p1,p2正交。

定理7 A A A n n n阶对称阵,则必有正交阵 P P P,使 P − 1 A P = P T A P = Λ P^{-1}AP=P^TAP=\Lambda P1AP=PTAP=Λ,其中 Λ \Lambda Λ是以 A A A n n n个特征值为对角元的对角阵。

推论 A A A n n n阶对称阵, λ \lambda λ A A A的特征方程的 k k k重根,则矩阵 A − λ E A -\lambda E AλE的秩 R ( A − λ E ) = n − k R(A -\lambda E)= n -k R(AλE)=nk,从而对应特征值 λ \lambda λ恰有 k k k个线性无关的特征向量。

二次型及其标准形

image-20210714170331942

image-20210714171542756

使二次型只含平方项,也就是用 ( 7 ) (7) (7)带入 ( 5 ) (5) (5),能使
f = k 1 y 1 2 + k 2 y 2 2 + ⋯ + k n y n 2 , f = k_1y^2_1 + k_2y_2^2 + \cdots + k_ny_n^2, f=k1y12+k2y22++knyn2,
这种只含平方项的二次型,称为二次型的标形型(或法式)。

如果标准形的系数 k 1 , k 2 , ⋯   , k n k_1,k_2,\cdots,k_n k1,k2,,kn只在 1 , − 1 , 0 1,-1,0 1,1,0三个数中取值,也就是用 ( 7 ) (7) (7)代入 ( 5 ) (5) (5),能使
f = y 1 2 + ⋯ + y p 2 − y p + 1 2 − ⋯ − y r 2 , f = y_1^2 + \cdots + y_p^2 - y^2_{p+1} - \cdots - y^2_r, f=y12++yp2yp+12yr2,
则称上式为二次型的规范形。

image-20210714171630813

则二次型可记作
f = x T A x , (8) f = x^TAx, \tag{8} f=xTAx,(8)
其中 A A A为对称阵。

image-20210714171827882

image-20210714174147905

如果 f ( x ) ≥ 0 f(x) \geq 0 f(x)0,则是半正定。

更新记录

  • 2021-05-25 补充单位矩阵、奇异矩阵
  • 2021-05-26 新增标准基、正交性
  • 2021-05-27 新增特征值
  • 2021-06-05 新增实对称矩阵定理
  • 2021-06-19 新值行列式

参考

  1. 《线性代数》 利昂著
  2. 《线性代数》 同济大学第五版
  3. 维基百科
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小丑西瓜9/article/detail/86998
推荐阅读
相关标签
  

闽ICP备14008679号