赞
踩
原创首发,转载请注明出处(CSDN:古希腊的汉密士),谢谢!
该篇文章以非齐次线性方程组为例题引出增广矩阵(A,b)的解集,配合矩阵的QR分解对增广矩阵(A,b)重新构造。在转置方面从代数的角度切入,但这个角度比较浅显。我们需要真正明白的是转置在向量空间层面发挥了什么作用。 重要提醒,在阅读该文章之前,必须将MIT线性代数习题公开课第11题的习题观看完毕并消化理解,这是串联所有知识点的脉络,其余只是模块组成。
e.g.1 求出非齐次方程组的通解
{
x
1
+
2
x
2
=
3
2
x
1
+
4
x
2
=
6
\left\{
解: 特解
X
∗
=
(
1
1
)
X^*=
零解
N
(
A
)
=
{
c
(
−
2
1
)
∣
c
∈
R
}
N(A)=\lbrace c
故原方程组解集为
S
(
A
,
b
)
=
{
(
1
1
)
+
c
(
−
2
1
)
∣
c
∈
R
}
S(A,b)=\lbrace
可以看出任意解都可以被分解成 特解 和 零解 。
那么对于线性方程组 x 1 a 1 + ⋯ + x n a n = β \displaystyle{x_1a_1+\cdots+x_na_n=\beta} x1a1+⋯+xnan=β 有解到底意味着什么呢?结合本人第二篇博文,我们对于方程式
x 1 a 1 + ⋯ + x n a n = β x_1a_1+\cdots+x_na_n=\beta x1a1+⋯+xnan=β
有解可以获得以下结论:
∗ \ast ∗注:以上几条结论可互相推导。
对于增广矩阵,有以下结构图:
(高等代数学习指导书(第二版上册)第14页)
首先我们来看一下什么是QR分解。
定理 如果 m × n \mathsf{m \times n} m×n 矩阵 A \mathsf{A} A 的列线性无关,那么A可以分解为 A = Q R A=QR A=QR,其中 Q Q Q是一个 m × n m \times n m×n矩阵,其列形成 C o l A Col A ColA的一个标准正交基,R是一个 n × n n \times n n×n上三角矩阵且在对角线上的元素为正数。若Q是一个方阵,则 Q − 1 = Q T Q^{-1}=Q^T Q−1=QT,Q为正交阵。令 Q = ( q 1 , … , q n ) Q=(q_1,\ldots,q_n) Q=(q1,…,qn),故
Q T Q = ( q 1 T ⋮ q n T ) ( q 1 … q n ) = ( 1 0 ⋯ 0 0 1 ⋯ 0 ⋮ ⋮ ⋱ ⋮ 0 0 ⋯ 1 ) n × n = I n Q^TQ=⎛⎝⎜⎜qT1⋮qTn⎞⎠⎟⎟ =(q1…qn) _{n \times n}=I_n QTQ= q1T⋮qnT (q1…qn)= 10⋮001⋮0⋯⋯⋱⋯00⋮1 n×n=In⎛⎝⎜⎜⎜⎜⎜10⋮001⋮0⋯⋯⋱⋯00⋮1⎞⎠⎟⎟⎟⎟⎟
应用方面:
P = ∑ i = 1 n ( a i T b a i T a i ) a i \mathsf{\color{red}P=\displaystyle\sum_{i=1}^n(\frac{a_i^Tb}{a_i^Ta_i})a_i} P=i=1∑n(aiTaiaiTb)ai
上述从基的角度细细的梳理了QR分解,请多看几遍并配合相关题目理解。
定义 设A为 m × n \mathsf{m \times n} m×n阶矩阵,第 i i i行 j j j 列的元素是 a ( i , j ) \mathsf{a(i,j)} a(i,j),即: A = ( a i j ) m × n A=(a_{ij})_{m \times n} A=(aij)m×n,把 m × n m \times n m×n矩阵A的行换成同序数的列得到一个 n × m \mathsf{n \times m} n×m矩阵,此矩阵叫做A的转置矩阵,记做 A T = ( a j i ) n × m \mathsf{A^T=(a_{ji})_{n \times m}} AT=(aji)n×m。
代数式表达: A = ( a i j ) m × n < f : T > A T = ( a j i ) n × m \mathsf{A=(a_{ij})_{m\times n}<f:T>A^T=(a_{ji})_{n \times m}} A=(aij)m×n<f:T>AT=(aji)n×m
绝大多数人运算的时候也只是在计算稿上将矩阵沿主对角线进行翻转,如
A
=
(
1
2
−
2
1
)
A=
e.g.2 A ∈ F m × n A \in F^{m \times n} A∈Fm×n, X ∈ F n × 1 X\in F^{n\times 1} X∈Fn×1, B ∈ F n × p B\in F^{n\times p} B∈Fn×p,则
(
A
x
)
T
=
(
x
1
A
1
+
⋯
+
x
n
A
n
)
T
=
x
1
A
1
T
+
⋯
+
x
n
A
n
T
=
(
x
1
x
2
⋯
x
n
)
(
A
1
T
A
2
T
⋮
A
n
T
)
=
x
T
A
T
(Ax)^T=(x_1A_1+\cdots+x_nA_n)^T=x_1A_1^T+\cdots+x_nA_n^T=
e.g.3
(
A
B
)
T
=
(
A
B
1
,
A
B
2
,
⋯
,
A
B
P
)
T
=
(
(
A
B
1
)
T
⋮
(
A
B
p
)
T
)
=
(
B
1
A
T
⋮
B
p
T
A
T
)
=
(
B
1
T
⋮
B
p
T
)
A
T
=
B
T
A
T
(AB)^T=(AB_1,AB_2,\cdots,AB_P)^T=
笔者在这里可以肯定,绝大多数人对转置的认知都停留在以上定义层面以及上述的代数运算层面。那转置在几何层面起什么作用呢?容笔者在这埋下一个伏笔,下面我们来快速的过一遍向量子空间。
笔者清华线性代数公开课笔记第一部分第27页
四个基本子空间的基的代数表达:
小贴士:在学习的数学的过程你需要很多固定的元认知模块,以便在学习的过程中像搭积木一样随取随用。比如上面四个子空间的代数表达式,心里知道核心图仅是第一步,第二步更重要,将其用数学语言代数化表达出来,这对于任何一个科目的学习都是通用的。类似的还有数乘,加法,乘法等。(如果有个“仓库”随时进行查找,也没有问题。)
在开始阅读之前,请确保你已经看完MIT线代习题公开课第11题,而且有了略微的理解。
注:笔者2019.11.30的线代习题公开课摘录笔记第7页
在计算的过程中,我们已经的得到了四个子空间的基底,下一步我们来看它是如何经过转置产生联系的。(直接上图)
习题公开课视频的讲解非常清晰,行空间(基底
{
(
5
0
3
)
,
(
0
1
1
)
}
\lbrace
小贴士:引申一个问题,向量“ ↗ \nearrow ↗”究竟是什么?经过以上的讲解,再将其理解为有方向、有长度的箭头是否已经有点太“低端”了呢?你必须理解,初次学习线性代数,引入一个“有方向、有长度的箭头”作为向量仅仅是为了让你建立几何直观方便入门,在学习的过程中,你要逐渐摒弃这个概念,真正从空间变化的角度来理解线性变换。更多时候,你要把向量看作是空间变化的线性载体。(观点启蒙于课程「线性代数的本质」)
P.S.1 学业中断后一两年方知读书好,在学校真幸福呀。真的很希望那段时间有一个长辈、学者做个引导指点个人学习的方向。太多人尤其是刚进大一的学子不知那几年的岁月对当时的他们意味着什么。分数不得,真正的学问也无,后悔者不在少数呀。「2021.5.19 16:27」
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。