赞
踩
线性方程组就是
a
11
∗
x
1
+
a
12
∗
x
2
+
a
13
∗
x
3
=
b
1
a11*x1+a12*x2+a13*x3 = b1
a11∗x1+a12∗x2+a13∗x3=b1
a 21 ∗ x 1 + a 22 ∗ x 2 + a 23 ∗ x 3 = b 2 a21*x1+a22*x2+a23*x3 = b2 a21∗x1+a22∗x2+a23∗x3=b2
a 31 ∗ x 1 + a 32 ∗ x 2 + a 33 ∗ x 3 = b 3 a31*x1+a32*x2+a33*x3 = b3 a31∗x1+a32∗x2+a33∗x3=b3
等价于
A
X
=
B
AX=B
AX=B
对线性方程组的理解包括横向和总纵向两种理解方法,也就是column picture和row picture
column picture是将线性方程组从竖直的角度来看,因为纵向来看,竖直的一组参数构成一组向量
v
1
=
{
a
11
a
21
a
31
}
v1 = \left\{
v
2
=
{
a
21
a
22
a
23
}
v2 = \left\{
v
3
=
{
a
31
a
32
a
33
}
v3 = \left\{
AX=B就可以理解为x是线性组合的权值,通过对v1,v2,v3的重新组合,得到了向量b
c
1
∗
v
1
+
c
2
∗
v
2
+
c
3
∗
v
3
=
b
c1*v1+c2*v2+c3*v3 = b
c1∗v1+c2∗v2+c3∗v3=b
{
v
1
v
2
v
3
}
∗
{
c
1
c
2
c
3
}
=
b
\{
除了从竖向解释线性方程组以外,还可以横向理解,其几何意义就是row picture。
因为每一个线性方程组其实都可以理解为是一条空间的直线,三个线性方程组横向理解,就是3条直线的交点坐标。
其实从对线性方程组意义的解读中,我们已经出现了线性方程组、向量方程和矩阵方程的关系。
线性方程组是矩阵最原始的意义,因为线性最初的含义就是用于解线性方程组
a
11
∗
x
1
+
a
12
∗
x
2
+
a
13
∗
x
3
=
b
1
a11*x1+a12*x2+a13*x3 = b1
a11∗x1+a12∗x2+a13∗x3=b1
a 21 ∗ x 1 + a 22 ∗ x 2 + a 23 ∗ x 3 = b 2 a21*x1+a22*x2+a23*x3 = b2 a21∗x1+a22∗x2+a23∗x3=b2
a
31
∗
x
1
+
a
32
∗
x
2
+
a
33
∗
x
3
=
b
3
a31*x1+a32*x2+a33*x3 = b3
a31∗x1+a32∗x2+a33∗x3=b3
而向量方程是从column picture的角度来思考线性方程的意义,就是对列向量的重新组合
{
a
11
a
21
a
31
}
∗
x
1
+
{
a
21
a
22
a
23
}
∗
x
2
+
{
a
31
a
32
a
33
}
∗
x
3
=
{
b
1
b
2
b
3
}
\left\{
而矩阵方程是对向量方程的进一步简化,是利用矩阵的乘法来描述这一重新线性组合关系
{
v
1
v
2
v
3
}
∗
{
x
1
x
2
x
3
}
=
B
\{
即
A
X
=
B
即 AX=B
即AX=B
谈到线性方程组,就一定会讨论其是否有解以及有多少个解的问题,也就是解的存在性与唯一性问题。
这里首先引入矩阵的阶梯式和最简阶梯式的概念,所谓阶梯式,就是矩阵从上往下,我们每一行第一个非零的数字叫做这一行的主元,上面一行的主元下面对应的位置必须全部是0,而且非零行必须在零行之上,比如
{
1
2
3
0
2
3
0
0
3
0
0
0
}
\left\{
第一行的1,第二行的2和第三行的3叫做主元;
主元1的下面全部是0,主元2的下面也是0
零行在非零行的下面
最简阶梯式是在阶梯式的基础上,每个主元行的上面元素必须也是0
{
1
0
0
0
2
0
0
0
3
0
0
0
}
\left\{
具有这种形式的矩阵叫做最简阶梯式
把原方程式的系数放在矩阵左边,结果列放在系数列的右边,构成一个多了一列的矩阵就是增广矩阵,比如
a
11
∗
x
1
+
a
12
∗
x
2
+
a
13
∗
x
3
=
b
1
a11*x1+a12*x2+a13*x3 = b1
a11∗x1+a12∗x2+a13∗x3=b1
a 21 ∗ x 1 + a 22 ∗ x 2 + a 23 ∗ x 3 = b 2 a21*x1+a22*x2+a23*x3 = b2 a21∗x1+a22∗x2+a23∗x3=b2
a 31 ∗ x 1 + a 32 ∗ x 2 + a 33 ∗ x 3 = b 3 a31*x1+a32*x2+a33*x3 = b3 a31∗x1+a32∗x2+a33∗x3=b3
系数矩阵
{
a
11
a
12
a
13
a
21
a
22
a
23
a
31
a
32
a
33
}
\left\{
增广矩阵
{
a
11
a
12
a
13
b
1
a
21
a
22
a
23
b
2
a
31
a
32
a
33
b
3
}
\left\{
我们可以看出,增广矩阵的含义其实就是左边的系数*变量=结果,如果我们把增广矩阵化成阶梯式
{
a
1
1
′
a
1
2
′
a
1
3
′
b
1
′
0
a
22
a
23
b
2
′
0
0
a
33
b
3
}
\left\{
就可以得到方程
a
1
1
′
∗
x
1
+
a
1
2
′
∗
x
2
+
a
1
3
′
∗
x
3
=
b
1
′
a11'*x1+a12'*x2+a13'*x3 = b1'
a11′∗x1+a12′∗x2+a13′∗x3=b1′
a 2 2 ′ ∗ x 2 + a 2 3 ′ ∗ x 3 = b 2 ′ a22'*x2+a23'*x3 = b2' a22′∗x2+a23′∗x3=b2′
a
3
3
′
∗
x
3
=
b
3
′
a33'*x3 = b3'
a33′∗x3=b3′
只有增广矩阵的阶梯形式不存在左边系数列是0,右边结果列非0的情况,这个线性方程组就有解,比如无解情况得到的矩阵
{
a
1
1
′
a
1
2
′
a
1
3
′
b
1
′
0
a
2
2
′
a
2
3
′
b
2
′
0
0
0
b
3
}
\left\{
最后一行得到方程 0 = b3’,如果b3’不是0,方程当然无解
如果化简为阶梯式的时候,得到了全零行,那么最后一行0=0必定恒成立,也就是说某个参数是没有约束条件的,等于几都可以,这样的变量叫做自由变量,有自由变量的方程组必定有无穷解。
{
a
1
1
′
a
1
2
′
a
1
3
′
b
1
′
0
a
2
2
′
a
2
′
3
b
2
′
0
0
0
0
}
\left\{
可以写成方程组
a
1
1
′
∗
x
1
+
a
1
2
′
∗
x
2
+
a
1
3
′
∗
x
3
=
b
1
′
a11'*x1+a12'*x2+a13'*x3 = b1'
a11′∗x1+a12′∗x2+a13′∗x3=b1′
a 2 2 ′ ∗ x 2 + a 2 3 ′ ∗ x 3 = b 2 ′ a22'*x2+a23'*x3 = b2' a22′∗x2+a23′∗x3=b2′
x 3 = x 3 x3 = x3 x3=x3
简化阶梯式法语上面解的存在与唯一性的时候写的基本一致,就是把矩阵化成最简阶梯式,然后就可以得到结果。
{
a
1
1
′
0
0
b
1
′
0
a
2
2
′
0
b
2
′
0
0
a
3
3
′
b
3
′
}
\left\{
可得
a
1
1
′
∗
x
1
=
b
1
′
a11'*x1= b1'
a11′∗x1=b1′
a 2 2 ′ ∗ x 2 = b 2 ′ a22'*x2 = b2' a22′∗x2=b2′
a 3 3 ′ ∗ x 3 = b 3 ′ a33'*x3 =b3' a33′∗x3=b3′
如果矩阵A是可逆的,那么可以利用逆矩阵法求解,不过计算量很大
A
X
=
B
AX=B
AX=B
X = A − 1 ∗ B X = A^{-1}*B X=A−1∗B
如果说A中列数多于行数,也就是说,方程数多于变量数,这种情况下,方程多半是无解的,但是可以利用投影的思想使用最小二乘法进行求解。把向量B投影到A的列空间上去,就能得到误差量最小的最小二乘解。
A
T
∗
(
b
−
A
∗
x
)
=
0
A^T*(b-A*x)=0
AT∗(b−A∗x)=0
A*x是利用A中的向量重新组合得到了b的投影向量,(b-A)*x是正交与列空间A的向量,利用投影向量的垂直分量正交与列空间的性质,可以得到最小二乘法方程,解得
x
=
(
A
T
∗
A
)
−
1
∗
A
T
∗
b
x = (A^T*A)^{-1}*A^T*b
x=(AT∗A)−1∗AT∗b
因为从原始矩阵变换为最简阶梯形经过了很多次行变换,行变换可以用一个矩阵来描述,最终得到的最简阶梯形是一个下三角矩阵,记为U,而多次行变换的乘积是一个上三角矩阵,记为L,即A=LU,原式可以表示为
L
∗
U
∗
X
=
b
L*U*X=b
L∗U∗X=b
令y=UX
L
∗
y
=
b
L*y = b
L∗y=b
因为L是下三角矩阵,解方程必然很快,得到y以后,再算Ux=y,U是上三角矩阵,计算也很快,用这种先拆分再解方程的LU分解法比最简阶梯形计算量更小一些
克拉默法则是一种利用行列式解方程的方法,求解行列式十分复杂,这里不想介绍,实用性不强。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。