赞
踩
对于人工智能的定义,学界一直有不同的表述,一种被广泛接受的说法是:人工智能是通过机器来模拟人类认知能力的技术。人工智能设计很广,涵盖了感知、学习、推理和决策等方面的能力。从实际应用的角度来说,人工智能最核心的能力就是根据给定的输入做出判断或预测。
1956年,达特茅斯会议标志着AI的诞生;
1957年,第一款神经网络Perceptron发明,AI到达第一个高峰期;
1974年,计算能力突破没能使机器完成大规模数据训练和复杂任务,AI进入第一个低谷;
1982年,霍普菲尔德神经网络被提出,在其中引入了相关联存储的机制;
1986年,BP算法出现使得大规模神经网络的训练成为可能,AI迎来第二个黄金期;
1990年,人工智能计算机DARPA没能实现政府投入缩减,AI进入第二次低谷;
2006年,Hinton提出深度学习神经网络使得AI性能获得突破性进展;
2012年,深度学习算法在语音和视觉识别上取得成功,AI进入感知智能时代。
第一次热潮:20世纪50年代,神经网络相关基础理论的提出;
第二次热潮:20世纪80年代,算法应用升级;
第三次热潮:2006年深度学习(深度神经网络)基本理论框架得到了验证,得益于海量数据处理能力的成熟,深度学习相关技术崛起。
图灵测试(The Turing test)由艾伦·麦席森·图灵发明,指测试者与被测试者(一个人和一台机器)隔开的情况下,通过一些装置(如键盘)向被测试者随意提问。进行多次测试后,如果机器让平均每个参与者做出超过30%的误判,那么这台机器就通过了测试,并被认为具有人类智能。
数据:必须要有大数据;
算法:学习算法的设计,你设计的大脑到底够不够聪明;
算力:要有高性能的计算能力,训练一个大的网络;
机器学习是一种实现人工智能的方法。是一门多领域交叉学科,设计概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域,它主要使用回归、综合而不是演绎。
深度学习是一种实现机器学习的技术。是利用深度的神经网络,将模型处理的更为复杂,从而使模型对数据的理解更加深入,是机器学习中一种基于对数据进行表征学习的方法。其动机在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来进行解释数据,例如图像、声音和文本。深度学习的实质,是通过构建具有很多隐层的机器学习模型和海量的训练数据,来学习更有用的特征,从而最终提升分类或预测的准确性。
人工神经网络是一种机器学习的算法。神经网络一般有输入层、隐藏层、输出层,一般来说隐藏层数量多于两层的网络就叫做深度神经网络,深度学习就是采用想深度神经网络这层深层架构的一种机器学习方法。
导数与微分的概念:
f
′
(
x
0
)
=
lim
Δ
x
→
0
f
(
x
0
+
Δ
x
)
−
f
(
x
0
)
Δ
x
f'(x_0)=\lim_{\Delta x\rightarrow0}\frac{f(x_0+\Delta x)-f(x_0)}{\Delta x}
f′(x0)=limΔx→0Δxf(x0+Δx)−f(x0)
或者:
f
′
(
x
0
)
=
lim
x
→
x
0
f
(
x
)
−
f
(
x
0
)
x
−
x
0
f'(x_0)=\lim_{x\rightarrow x_0}\frac{f(x)-f(x_0)}{x-x_0}
f′(x0)=limx→x0x−x0f(x)−f(x0)
函数
f
(
x
)
f(x)
f(x)在
x
0
x_0
x0处的左右导数分别定义为:
左导数:
f
′
_
(
x
0
)
=
lim
Δ
x
→
0
−
f
(
x
0
+
Δ
x
)
−
f
(
x
0
)
Δ
x
=
lim
x
→
x
0
−
f
(
x
)
−
f
(
x
0
)
x
−
x
0
,
(
x
=
x
0
+
Δ
x
)
f'\_(x_0)=\lim_{\Delta x\rightarrow0^-}\frac{f(x_0+\Delta x)-f(x_0)}{\Delta x}=\lim_{x\rightarrow x_0^-}\frac{f(x)-f(x_0)}{x-x_0},(x=x_0+\Delta x)
f′_(x0)=limΔx→0−Δxf(x0+Δx)−f(x0)=limx→x0−x−x0f(x)−f(x0),(x=x0+Δx)
右导数:
f
+
′
(
x
0
)
=
lim
Δ
x
→
0
+
f
(
x
0
+
Δ
x
)
−
f
(
x
0
)
Δ
x
=
lim
x
→
x
0
+
f
(
x
)
−
f
(
x
0
)
x
−
x
0
f'_+(x_0)=\lim_{\Delta x\rightarrow0^+}\frac{f(x_0+\Delta x)-f(x_0)}{\Delta x}=\lim_{x\rightarrow x_0^+}\frac{f(x)-f(x_0)}{x-x_0}
f+′(x0)=limΔx→0+Δxf(x0+Δx)−f(x0)=limx→x0+x−x0f(x)−f(x0)
Th1:函数
f
(
x
)
f(x)
f(x)在
x
0
x_0
x0处可微
⇔
\Leftrightarrow
⇔
f
(
x
)
f(x)
f(x)在
x
0
x_0
x0处可导。
Th2:若函数在点
x
0
x_0
x0处可导,则
y
=
f
(
x
)
y=f(x)
y=f(x)在点
x
0
x_0
x0处连续,反之则不一定成立,即函数连续不一定可导。
Th3:
f
(
x
0
)
f(x_0)
f(x0)存在,则
f
−
′
(
x
0
)
=
f
+
′
(
x
0
)
f'_-(x_0)=f'_+(x_0)
f−′(x0)=f+′(x0)。
切线方程:
y
−
y
0
=
f
′
(
x
0
)
(
x
−
x
0
)
y-y_0=f'(x_0)(x-x_0)
y−y0=f′(x0)(x−x0)
法线方程:
y
−
y
0
=
−
1
f
′
(
x
0
)
(
x
−
x
0
)
,
f
′
(
x
0
)
≠
0
y-y_0=-\frac1{f'(x_0)}(x-x_0),f'(x_0)\neq0
y−y0=−f′(x0)1(x−x0),f′(x0)=0
设函数
u
=
u
(
x
)
,
v
=
v
(
x
)
u=u(x),v=v(x)
u=u(x),v=v(x)在点
x
x
x处可导,则:
(1)
(
u
±
v
)
′
=
u
′
±
v
′
{(u\pm v)}'=u'\pm v'
(u±v)′=u′±v′
(2)
(
u
v
)
′
=
u
v
′
+
v
u
′
{(uv)}'=uv'+vu'
(uv)′=uv′+vu′
\;\;\;\;\;\;\;\;\;\;\;\;
d
(
u
v
)
=
u
d
v
+
v
d
u
d(uv)=udv+vdu
d(uv)=udv+vdu
(3)
(
u
v
)
′
=
u
v
′
−
v
u
′
v
2
(
v
≠
0
)
{(\frac uv)}'=\frac{uv'-vu'}{v^2}(v\neq0)
(vu)′=v2uv′−vu′(v=0)
\;\;\;\;\;\;
d
(
u
v
)
=
v
d
u
−
u
d
v
v
2
d(\frac uv)=\frac{vdu-udv}{v^2}
d(vu)=v2vdu−udv
(1)
y
=
c
y=c
y=c(常数),则
y
′
=
0
d
y
=
0
y'=0\;\;\;\;\;dy=0
y′=0dy=0
(2)
y
=
x
α
y=x^\alpha
y=xα(
α
\alpha
α为实数),则
y
′
=
0
d
y
=
0
y'=0\;\;\;\;\;dy=0
y′=0dy=0
(3)
y
=
α
x
y=\alpha^x
y=αx(
α
\alpha
α常数),则
y
′
=
α
x
ln
α
d
y
=
α
x
ln
α
d
x
y'=\alpha^x\ln\alpha\;\;\;dy=\alpha^x\ln\alpha dx
y′=αxlnαdy=αxlnαdx
\;
特例
(
e
x
)
′
=
e
x
d
(
e
x
)
=
e
x
d
x
(e^x)'=e^x\;\;d(e^x)=e^xdx
(ex)′=exd(ex)=exdx
(4)
y
=
log
a
x
y=\log_ax
y=logax(
α
\alpha
α常数),则
y
′
=
1
x
ln
a
d
y
=
1
x
ln
a
d
x
y'=\frac1{x\ln a}\;\;\;\;\;dy=\frac1{x\ln a}dx
y′=xlna1dy=xlna1dx
\;
特例
(
ln
x
)
′
=
1
x
d
(
ln
x
)
=
1
x
d
x
(\ln x)'=\frac1x\;\;d(\ln x)=\frac1xdx
(lnx)′=x1d(lnx)=x1dx
(5)
y
=
s
i
n
x
y=sinx
y=sinx,则
y
′
=
c
o
s
x
d
(
s
i
n
x
)
=
c
o
s
x
d
x
y'=cosx\;\;\;\;\;d(sinx)=cosxdx
y′=cosxd(sinx)=cosxdx
(6)
y
=
c
o
s
x
y=cosx
y=cosx,则
y
′
=
−
s
i
n
x
d
(
c
o
s
x
)
=
−
s
i
n
x
d
x
y'=-sinx\;\;\;\;\;d(cosx)=-sinxdx
y′=−sinxd(cosx)=−sinxdx
(7)
y
=
t
a
n
x
y=tanx
y=tanx,则
y
′
=
1
cos
2
x
=
s
e
c
2
x
d
(
tan
x
)
=
s
e
c
2
x
d
x
y'=\frac1{\cos^2x}=sec^2x\;\;d(\tan x)=sec^2xdx
y′=cos2x1=sec2xd(tanx)=sec2xdx
(8)
y
=
c
o
t
x
y=cotx
y=cotx,则
y
′
=
−
1
sin
2
x
=
−
c
s
c
2
x
d
(
cot
x
)
=
−
c
s
c
2
x
d
x
y'=-\frac1{\sin^2x}=-csc^2x\;\;d(\cot x)=-csc^2xdx
y′=−sin2x1=−csc2xd(cotx)=−csc2xdx
(9)
y
=
s
e
c
x
y=secx
y=secx,则
y
′
=
s
e
c
x
t
a
n
x
d
(
s
e
c
x
)
=
s
e
c
x
t
a
n
x
d
x
y'=secxtanx\;\;\;\;\;d(secx)=secxtanxdx
y′=secxtanxd(secx)=secxtanxdx
(10)
y
=
c
s
c
x
y=cscx
y=cscx,则
y
′
=
−
c
s
c
x
c
o
t
x
d
(
c
s
c
x
)
=
−
c
s
c
x
c
o
t
x
d
x
y'=-cscxcotx\;\;\;\;\;d(cscx)=-cscxcotxdx
y′=−cscxcotxd(cscx)=−cscxcotxdx
(11)
y
=
a
r
c
sin
x
y=arc\sin x
y=arcsinx,则
y
′
=
1
1
−
x
2
d
(
a
r
c
sin
x
)
=
1
1
−
x
2
d
x
y'=\frac1{\sqrt{1-x^2}}\;\;d(arc\sin x)=\frac1{\sqrt{1-x^2}}dx
y′=1−x2
1d(arcsinx)=1−x2
1dx
(12)
y
=
a
r
c
cos
x
y=arc\cos x
y=arccosx,则
y
′
=
−
1
1
−
x
2
d
(
a
r
c
cos
x
)
=
−
1
1
−
x
2
d
x
y'=-\frac1{\sqrt{1-x^2}}\;\;d(arc\cos x)=-\frac1{\sqrt{1-x^2}}dx
y′=−1−x2
1d(arccosx)=−1−x2
1dx
(13)
y
=
a
r
c
tan
x
y=arc\tan x
y=arctanx,则
y
′
=
1
1
+
x
2
d
(
a
r
c
tan
x
)
=
1
1
+
x
2
d
x
y'=\frac1{1+x^2}\;\;d(arc\tan x)=\frac1{1+x^2}dx
y′=1+x21d(arctanx)=1+x21dx
(14)
y
=
a
r
c
cot
x
y=arc\cot x
y=arccotx,则
y
′
=
−
1
1
+
x
2
d
(
a
r
c
cot
x
)
=
−
1
1
+
x
2
d
x
y'=-\frac1{1+x^2}\;\;d(arc\cot x)=-\frac1{1+x^2}dx
y′=−1+x21d(arccotx)=−1+x21dx
(15)
y
=
s
h
x
y=shx
y=shx,则
y
′
=
c
h
x
d
(
s
h
x
)
=
c
h
x
d
x
y'=chx\;\;\;\;\;d(shx)=chxdx
y′=chxd(shx)=chxdx
(15)
y
=
c
h
x
y=chx
y=chx,则
y
′
=
s
h
x
d
(
c
h
x
)
=
s
h
x
d
x
y'=shx\;\;\;\;\;d(chx)=shxdx
y′=shxd(chx)=shxdx
(1)反函数的运算法则,设
y
=
f
(
x
)
y=f(x)
y=f(x)在点
x
x
x的某淋雨内单调连续,则点
x
x
x处可到且
f
′
(
x
0
)
≠
0
f'(x_0)\neq0
f′(x0)=0,则其反函数在点
x
x
x所对应的
y
y
y处可到,并且有
d
y
d
x
=
1
d
x
d
y
\frac{dy}{dx}=\frac1{\displaystyle\frac{dx}{dy}}
dxdy=dydx1;
(2符合函数的运算法则:若
μ
=
φ
(
x
)
\mu=\varphi(x)
μ=φ(x)在点
x
x
x可导,而
y
=
f
(
μ
)
y=f(\mu)
y=f(μ)在对应点
μ
(
u
=
φ
(
x
)
)
\mu(u=\varphi(x))
μ(u=φ(x))可导,则复合函数
y
=
f
(
φ
(
x
)
)
y=f(\varphi(x))
y=f(φ(x))在点
x
x
x可导,且
y
′
=
f
′
(
u
)
φ
′
(
x
)
y'=f'(u)\varphi'(x)
y′=f′(u)φ′(x)
(3隐函数导数
d
y
d
x
\frac{dy}{dx}
dxdy的求法一般有三种方法:
1)方程两边对
x
x
x求导,要记住
y
y
y是
x
x
x的导数,则
y
y
y的函数是
x
x
x的复合函数,例如
1
y
,
y
2
,
ln
y
,
e
y
\frac1y,y^2,\ln y,e^y
y1,y2,lny,ey等均是
x
x
x的复合函数,对
x
x
x求导应按照复合函数连锁法则做;
2)公式法,由
F
(
x
,
y
)
=
0
F(x,y)=0
F(x,y)=0知
d
y
d
x
=
−
F
x
′
(
x
,
y
)
F
y
′
(
x
,
y
)
\frac{dy}{dx}=-\frac{F'_x(x,y)}{F'_y(x,y)}
dxdy=−Fy′(x,y)Fx′(x,y),其中,
F
x
′
(
x
,
y
)
,
F
y
′
(
x
,
y
)
F'_x(x,y),F'_y(x,y)
Fx′(x,y),Fy′(x,y)分别表示
F
(
x
,
y
)
F(x,y)
F(x,y)对
x
x
x和
y
y
y的偏导数;
3)利用微分形式不变性
(1)
(
a
x
)
(
n
)
=
a
x
ln
n
a
(
a
>
0
)
(
e
x
)
(
n
)
=
e
x
{(a^x)}^{(n)}=a^x\ln^na\;\;(a>0)\;\;\;\;\;\;{(e^x)}^{(n)}=e^x
(ax)(n)=axlnna(a>0)(ex)(n)=ex
(2)
(
sin
d
x
)
(
n
)
=
k
n
sin
(
k
x
+
n
⋅
π
2
)
{(\sin dx)}^{(n)}=k^n\sin(kx+n\cdot\frac\pi2)
(sindx)(n)=knsin(kx+n⋅2π)
(3)
(
cos
d
x
)
(
n
)
=
k
n
cos
(
k
x
+
n
⋅
π
2
)
{(\cos dx)}^{(n)}=k^n\cos(kx+n\cdot\frac\pi2)
(cosdx)(n)=kncos(kx+n⋅2π)
(4)
(
x
m
)
(
n
)
=
m
(
m
−
1
)
⋯
(
m
−
n
+
1
)
x
m
−
n
{(x^m)}^{(n)}=m(m-1)\cdots(m-n+1)x^{m-n}
(xm)(n)=m(m−1)⋯(m−n+1)xm−n
(5)
(
ln
x
)
(
n
)
=
(
−
1
)
(
n
−
1
)
(
n
−
1
)
!
x
n
{(\ln x)}^{(n)}={(-1)}^{(n-1)}\frac{(n-1)!}{x^n}
(lnx)(n)=(−1)(n−1)xn(n−1)!
(6)莱布尼兹公式:若
u
(
x
)
,
v
(
x
)
u(x),v(x)
u(x),v(x)均为
n
n
n阶可导,则,
(
u
v
)
(
n
)
=
∑
i
=
0
n
c
n
i
u
(
i
)
v
(
n
−
i
)
{(uv)}^{(n)}={\textstyle\sum_{i=0}^n}c_n^iu^{(i)}v^{(n-i)}
(uv)(n)=∑i=0ncniu(i)v(n−i),其中
u
(
0
)
=
u
,
v
(
0
)
=
v
u^{(0)}=u,v^{(0)}=v
u(0)=u,v(0)=v
Th1:费马定理
若函数
f
(
x
)
f(x)
f(x)满足条件:
(1)函数
f
(
x
)
f(x)
f(x)在
x
0
x_0
x0的某邻域内有定义,并且在此邻域内恒有
f
(
x
)
≤
f
(
x
0
)
f(x)\leq f(x_0)
f(x)≤f(x0)或
f
(
x
)
≥
f
(
x
0
)
f(x)\geq f(x_0)
f(x)≥f(x0),
(2)
f
(
x
)
f(x)
f(x)在
x
0
x_0
x0处可导,则有
f
′
(
x
0
)
=
0
f'(x_0)=0
f′(x0)=0。
Th2:罗尔定理
设函数
f
(
x
)
f(x)
f(x)满足条件:
(1)在闭区间
[
a
,
b
]
[a,b]
[a,b]上连续; (2)在
(
a
,
b
)
(a,b)
(a,b)上可导; (3)
f
(
a
)
=
f
(
b
)
f(a)=f(b)
f(a)=f(b)
则在
(
a
,
b
)
(a,b)
(a,b)内
∃
\exists
∃一个
ξ
\xi
ξ,使
f
′
(
ξ
)
=
0
f'(\xi)=0
f′(ξ)=0。
Th3:拉格朗日中值定理
设函数
f
(
x
)
f(x)
f(x)满足条件:
(1)在闭区间
[
a
,
b
]
[a,b]
[a,b]上连续; (2)在
(
a
,
b
)
(a,b)
(a,b)上可导;
则在
(
a
,
b
)
(a,b)
(a,b)内
∃
\exists
∃一个
ξ
\xi
ξ,使
f
(
b
)
−
f
(
a
)
b
−
a
=
f
′
(
ξ
)
\frac{f(b)-f(a)}{b-a}=f'(\xi)
b−af(b)−f(a)=f′(ξ)。
Th4:柯西中值定理
设函数
f
(
x
)
,
g
(
x
)
f(x),g(x)
f(x),g(x)满足条件:
(1)在闭区间
[
a
,
b
]
[a,b]
[a,b]上连续; (2)在
(
a
,
b
)
(a,b)
(a,b)上可导且
f
′
(
x
)
,
g
′
(
x
)
f'(x),g'(x)
f′(x),g′(x)均存在,且
g
′
(
x
)
≠
0
g'(x)\neq0
g′(x)=0;
则在
(
a
,
b
)
(a,b)
(a,b)内存在一个
ξ
\xi
ξ,使
f
(
b
)
−
f
(
a
)
f
(
b
)
−
g
(
a
)
=
f
(
ξ
)
g
(
ξ
)
\frac{f(b)-f(a)}{f(b)-g(a)}=\frac{f(\xi)}{g(\xi)}
f(b)−g(a)f(b)−f(a)=g(ξ)f(ξ)。
法则
I
\Iota
I(
0
0
\frac00
00型不定式极限)
设函数
f
(
x
)
,
g
(
x
)
f(x),g(x)
f(x),g(x)满足条件:
lim
x
→
x
0
f
(
x
)
=
0
,
lim
x
→
x
0
g
(
x
)
=
0
\lim_{x\rightarrow x_0}f(x)=0,\lim_{x\rightarrow x_0}g(x)=0
limx→x0f(x)=0,limx→x0g(x)=0;
f
(
x
)
,
g
(
x
)
f(x),g(x)
f(x),g(x)在
x
0
x_0
x0的邻域内可导(在
x
0
x_0
x0处可除外)且
g
′
(
x
)
≠
0
g'(x)\neq0
g′(x)=0;
lim
x
→
x
0
f
′
(
x
)
g
′
(
x
)
\lim_{x\rightarrow x_0}\frac{f'(x)}{g'(x)}
limx→x0g′(x)f′(x)存在(或
∞
\infty
∞)。
则
lim
x
→
x
0
f
(
x
)
g
(
x
)
=
lim
x
→
x
0
f
′
(
x
)
g
′
(
x
)
\lim_{x\rightarrow x_0}\frac{f(x)}{g(x)}=\lim_{x\rightarrow x_0}\frac{f'(x)}{g'(x)}
limx→x0g(x)f(x)=limx→x0g′(x)f′(x)。
法则
I
\Iota
I(
0
0
\frac00
00型不定式极限)
设函数
f
(
x
)
,
g
(
x
)
f(x),g(x)
f(x),g(x)满足条件:
lim
x
→
x
0
f
(
x
)
=
0
,
lim
x
→
x
0
g
(
x
)
=
0
\lim_{x\rightarrow x_0}f(x)=0,\lim_{x\rightarrow x_0}g(x)=0
limx→x0f(x)=0,limx→x0g(x)=0;存在一个
X
>
0
X>0
X>0,当
∣
x
∣
>
X
|x|>X
∣x∣>X时,
f
(
x
)
,
g
(
x
)
f(x),g(x)
f(x),g(x)可导,且
g
′
(
x
)
≠
0
g'(x)\neq0
g′(x)=0;
lim
x
→
x
0
f
′
(
x
)
g
′
(
x
)
\lim_{x\rightarrow x_0}\frac{f'(x)}{g'(x)}
limx→x0g′(x)f′(x)存在(或
∞
\infty
∞)。
则
lim
x
→
x
0
f
(
x
)
g
(
x
)
=
lim
x
→
x
0
f
′
(
x
)
g
′
(
x
)
\lim_{x\rightarrow x_0}\frac{f(x)}{g(x)}=\lim_{x\rightarrow x_0}\frac{f'(x)}{g'(x)}
limx→x0g(x)f(x)=limx→x0g′(x)f′(x)。
法则
I
I
\Iota\Iota
II(
∞
∞
\frac\infty\infty
∞∞型不定式极限)
设函数
f
(
x
)
,
g
(
x
)
f(x),g(x)
f(x),g(x)满足条件:
lim
x
→
x
0
f
(
x
)
=
∞
,
lim
x
→
x
0
g
(
x
)
=
∞
\lim_{x\rightarrow x_0}f(x)=\infty,\lim_{x\rightarrow x_0}g(x)=\infty
limx→x0f(x)=∞,limx→x0g(x)=∞;
f
(
x
)
,
g
(
x
)
f(x),g(x)
f(x),g(x)在
x
0
x_0
x0的邻域内可导(在
x
0
x_0
x0处可除外)且
g
′
(
x
)
≠
0
g'(x)\neq0
g′(x)=0;
lim
x
→
x
0
f
′
(
x
)
g
′
(
x
)
\lim_{x\rightarrow x_0}\frac{f'(x)}{g'(x)}
limx→x0g′(x)f′(x)存在(或
∞
\infty
∞)。
则
lim
x
→
x
0
f
(
x
)
g
(
x
)
=
lim
x
→
x
0
f
′
(
x
)
g
′
(
x
)
\lim_{x\rightarrow x_0}\frac{f(x)}{g(x)}=\lim_{x\rightarrow x_0}\frac{f'(x)}{g'(x)}
limx→x0g(x)f(x)=limx→x0g′(x)f′(x)。
同理法则法则
I
I
’
\Iota\Iota’
II’(
∞
∞
\frac\infty\infty
∞∞型不定式极限)仿法则
I
′
\Iota'
I′写出。
设函数
f
(
x
)
f(x)
f(x)在
x
0
x_0
x0处的某邻域内具有
n
+
1
n+1
n+1阶导数,则对该淋浴内异于
x
0
x_0
x0的任意点x,在
x
0
x_0
x0于
x
x
x之间至少存在一个
ξ
\xi
ξ,使得:
f
(
x
)
=
f
(
x
0
)
+
f
′
(
x
0
)
(
x
−
x
0
)
+
1
2
!
f
′
′
(
x
0
)
(
x
−
x
0
)
2
+
⋯
+
f
(
n
)
(
x
0
)
n
!
(
x
−
x
0
)
n
+
R
n
(
x
)
f(x)=f(x_0)+f'(x_0)(x-x_0)+\frac1{2!}f''(x_0){(x-x_0)}^2+\cdots+\frac{f^{(n)}(x_0)}{n!}{(x-x_0)}^n+R_n(x)
f(x)=f(x0)+f′(x0)(x−x0)+2!1f′′(x0)(x−x0)2+⋯+n!f(n)(x0)(x−x0)n+Rn(x)
其中
R
n
(
x
)
=
f
(
n
+
1
)
(
ξ
)
(
n
+
1
)
!
(
x
−
x
0
)
n
+
1
R_n(x)=\frac{f^{(n+1)}(\xi)}{(n+1)!}{(x-x_0)}^{n+1}
Rn(x)=(n+1)!f(n+1)(ξ)(x−x0)n+1称为
f
(
x
)
f(x)
f(x)在点
x
0
x_0
x0处的n阶泰勒余项。
令
x
0
=
0
x_0=0
x0=0,则
n
n
n阶泰勒公式:
f
(
x
)
=
f
(
0
)
+
f
′
(
0
)
x
+
1
2
!
f
′
′
(
0
)
x
2
+
⋯
+
f
(
n
)
(
0
)
n
!
x
n
+
R
n
(
x
)
⋯
⋯
f(x)=f(0)+f'(0)x+\frac1{2!}f''(0)x^2+\cdots+\frac{f^{(n)}(0)}{n!}x^n+R_n(x)\cdots\cdots
f(x)=f(0)+f′(0)x+2!1f′′(0)x2+⋯+n!f(n)(0)xn+Rn(x)⋯⋯
(1)其中
R
n
(
x
)
=
f
(
n
+
1
)
(
ξ
)
(
n
+
1
)
!
x
n
+
1
R_n(x)=\frac{f^{(n+1)}(\xi)}{(n+1)!}{x}^{n+1}
Rn(x)=(n+1)!f(n+1)(ξ)xn+1,
ξ
\xi
ξ在
0
0
0和
x
x
x之间。(1)式称为麦克劳林公式。
常用五中函数在
x
0
=
0
x_0=0
x0=0处的泰勒公式:
1)
e
x
=
1
+
x
+
1
2
!
x
2
+
⋯
+
1
n
!
x
n
+
x
n
+
1
(
n
+
1
)
!
e
ξ
e^x=1+x+\frac1{2!}x^2+\cdots+\frac1{n!}x^n+\frac{x^{n+1}}{(n+1)!}e^\xi
ex=1+x+2!1x2+⋯+n!1xn+(n+1)!xn+1eξ
或
e
x
=
1
+
x
+
1
2
!
x
2
+
⋯
+
1
n
!
x
n
+
o
(
x
n
)
e^x=1+x+\frac1{2!}x^2+\cdots+\frac1{n!}x^n+o(x^n)
ex=1+x+2!1x2+⋯+n!1xn+o(xn)
2)
sin
x
=
x
−
1
3
!
x
3
+
⋯
+
x
n
n
!
sin
n
π
2
+
x
n
+
1
(
n
+
1
)
!
sin
(
ξ
+
n
+
1
2
π
)
\sin x=x-\frac1{3!}x^3+\cdots+\frac{x^n}{n!}\sin\frac{n\pi}2+\frac{x^{n+1}}{(n+1)!}\sin(\xi+\frac{n+1}2\pi)
sinx=x−3!1x3+⋯+n!xnsin2nπ+(n+1)!xn+1sin(ξ+2n+1π)
或
sin
x
=
x
−
1
3
!
x
3
+
⋯
+
x
n
n
!
sin
n
π
2
+
o
(
x
n
)
\sin x=x-\frac1{3!}x^3+\cdots+\frac{x^n}{n!}\sin\frac{n\pi}2+o(x^n)
sinx=x−3!1x3+⋯+n!xnsin2nπ+o(xn)
3)
cos
x
=
x
−
1
2
!
x
2
+
⋯
+
x
n
n
!
cos
n
π
2
+
x
n
+
1
(
n
+
1
)
!
cos
(
ξ
+
n
+
1
2
π
)
\cos x=x-\frac1{2!}x^2+\cdots+\frac{x^n}{n!}\cos\frac{n\pi}2+\frac{x^{n+1}}{(n+1)!}\cos(\xi+\frac{n+1}2\pi)
cosx=x−2!1x2+⋯+n!xncos2nπ+(n+1)!xn+1cos(ξ+2n+1π)
或
cos
x
=
x
−
1
2
!
x
2
+
⋯
+
x
n
n
!
cos
n
π
2
+
o
(
x
n
)
\cos x=x-\frac1{2!}x^2+\cdots+\frac{x^n}{n!}\cos\frac{n\pi}2+o(x^n)
cosx=x−2!1x2+⋯+n!xncos2nπ+o(xn)
4)
ln
(
1
+
x
)
=
x
−
1
2
!
x
2
+
1
3
!
x
3
−
⋯
+
(
−
1
)
n
x
n
n
!
+
(
−
1
)
n
x
n
(
n
+
1
)
(
1
+
ξ
)
n
+
1
\ln(1+x)=x-\frac1{2!}x^2+\frac1{3!}x^3-\cdots+{(-1)}^n\frac{x^n}{n!}+\frac{{(-1)}^nx^n}{(n+1){(1+\xi)}^{n+1}}
ln(1+x)=x−2!1x2+3!1x3−⋯+(−1)nn!xn+(n+1)(1+ξ)n+1(−1)nxn
或
ln
(
1
+
x
)
=
x
−
1
2
!
x
2
+
1
3
!
x
3
−
⋯
+
(
−
1
)
n
x
n
n
!
+
o
(
x
n
)
\ln(1+x)=x-\frac1{2!}x^2+\frac1{3!}x^3-\cdots+{(-1)}^n\frac{x^n}{n!}+o(x^n)
ln(1+x)=x−2!1x2+3!1x3−⋯+(−1)nn!xn+o(xn)
5)
(
1
+
x
)
m
=
1
+
m
x
+
m
(
m
−
1
)
2
!
x
2
+
⋯
+
m
(
m
−
1
)
⋯
(
m
−
n
+
1
)
n
!
x
n
+
m
(
m
−
1
)
⋯
(
m
−
n
+
1
)
(
n
+
1
)
!
x
n
+
1
(
1
+
ξ
)
m
−
n
−
1
{(1+x)}^m=1+mx+\frac{m(m-1)}{2!}x^2+\cdots+\frac{m(m-1)\cdots(m-n+1)}{n!}x^n+\frac{m(m-1)\cdots(m-n+1)}{(n+1)!}x^{n+1}{(1+\xi)}^{m-n-1}\;
(1+x)m=1+mx+2!m(m−1)x2+⋯+n!m(m−1)⋯(m−n+1)xn+(n+1)!m(m−1)⋯(m−n+1)xn+1(1+ξ)m−n−1
或
(
1
+
x
)
m
=
1
+
m
x
+
m
(
m
−
1
)
2
!
x
2
+
⋯
+
m
(
m
−
1
)
⋯
(
m
−
n
+
1
)
n
!
x
n
+
o
(
x
n
)
{(1+x)}^m=1+mx+\frac{m(m-1)}{2!}x^2+\cdots+\frac{m(m-1)\cdots(m-n+1)}{n!}x^n+o(x^n)
(1+x)m=1+mx+2!m(m−1)x2+⋯+n!m(m−1)⋯(m−n+1)xn+o(xn)
Th1:设函数
f
(
x
)
f(x)
f(x)在
(
a
,
b
)
(a,b)
(a,b)区间内可导,如果对
∀
x
∈
(
a
,
b
)
\forall x\in(a,b)
∀x∈(a,b),都有
f
′
(
x
)
>
0
f'(x)>0
f′(x)>0(或
f
′
(
x
)
<
0
f'(x)<0
f′(x)<0),则函数
f
(
x
)
f(x)
f(x)在
(
a
,
b
)
(a,b)
(a,b)内是单调增加的(或单调减少的)。
Th2:(取极值得必要条件)设
f
(
x
)
f(x)
f(x)在
x
0
x_0
x0处可导,且在
x
0
x_0
x0处取极值,则
f
′
(
x
0
)
>
0
f'(x_0)>0
f′(x0)>0。
Th3:(取极值的第一充分条件)设
f
(
x
)
f(x)
f(x)在
x
0
x_0
x0的某一邻域内可微,且
f
′
(
x
0
)
=
0
f'(x_0)=0
f′(x0)=0(或
f
(
x
)
f(x)
f(x)在
x
0
x_0
x0处连续,但
f
′
(
x
0
)
=
0
f'(x_0)=0
f′(x0)=0不存在):
(1)当
x
x
x经过
x
0
x_0
x0时,
f
′
(
x
)
f'(x)
f′(x)由
"
+
"
"+"
"+"变
"
−
"
"-"
"−",则
f
(
x
0
)
f(x_0)
f(x0)为极大值;
(2)当
x
x
x经过
x
0
x_0
x0时,
f
′
(
x
)
f'(x)
f′(x)由
"
−
"
"-"
"−"变
"
+
"
"+"
"+",则
f
(
x
0
)
f(x_0)
f(x0)为极小值;
(2)当
f
′
(
x
)
f'(x)
f′(x)经过
x
=
x
0
x=x_0
x=x0的两侧不变号,则
f
(
x
0
)
f(x_0)
f(x0)不是极值;
Th4:(取极值的第二充分条件)设
f
(
x
)
f(x)
f(x)在
x
0
x_0
x0处有
f
′
′
(
x
0
)
≠
0
f''(x_0)\neq0
f′′(x0)=0,且
f
′
(
x
)
=
0
f'(x)=0
f′(x)=0,则:
当
f
′
′
(
x
0
)
<
0
f''(x_0)<0
f′′(x0)<0时,
f
(
x
0
)
f(x_0)
f(x0)为极大值;当
f
′
′
(
x
0
)
>
0
f''(x_0)>0
f′′(x0)>0时,
f
(
x
0
)
f(x_0)
f(x0)为极小值。注:如果
f
′
′
(
x
0
)
=
0
f''(x_0)=0
f′′(x0)=0,此方法失效。
(1)水平渐近线
若
lim
x
→
+
∞
f
(
x
)
=
b
\lim_{x\rightarrow+\infty}f(x)=b
limx→+∞f(x)=b,或
lim
x
→
−
∞
f
(
x
)
=
b
\lim_{x\rightarrow-\infty}f(x)=b
limx→−∞f(x)=b,则称
y
=
b
y=b
y=b为函数
y
=
f
(
x
)
y=f(x)
y=f(x)的水平渐近线。
(2)铅直渐近线
若
lim
x
→
x
0
−
f
(
x
)
=
∞
\lim_{x\rightarrow x_0^-}f(x)=\infty
limx→x0−f(x)=∞,或
lim
x
→
x
0
+
f
(
x
)
=
∞
\lim_{x\rightarrow x_0^+}f(x)=\infty
limx→x0+f(x)=∞,则称
x
=
x
0
x=x_0
x=x0为函数
y
=
f
(
x
)
y=f(x)
y=f(x)的铅直渐近线。
(2)斜渐近线
若
a
=
lim
x
→
∞
f
(
x
)
x
,
b
=
lim
x
→
∞
[
f
(
x
)
−
a
x
]
a=\lim_{x\rightarrow\infty}\frac{f(x)}x,b=\lim_{x\rightarrow\infty}\lbrack f(x)-ax\rbrack
a=limx→∞xf(x),b=limx→∞[f(x)−ax],则称
y
=
a
x
+
b
y=ax+b
y=ax+b为函数
y
=
f
(
x
)
y=f(x)
y=f(x)的斜渐近线。
Th1:(凹凸性的判别定理)若在
I
\Iota
I上
f
′
′
(
x
)
<
0
f''(x)<0
f′′(x)<0(或
f
′
′
(
x
)
>
0
f''(x)>0
f′′(x)>0),则
f
(
x
)
f(x)
f(x)在
I
\Iota
I时凸(或凹)的。
Th2:(拐点的判别定理1)若在
x
0
x_0
x0处
f
′
′
(
x
)
=
0
f''(x)=0
f′′(x)=0,(或
f
′
′
(
x
)
f''(x)
f′′(x)不存在),当
x
x
x变动经过
x
0
x_0
x0时,
f
′
′
(
x
)
f''(x)
f′′(x)变号,则
(
x
0
,
f
(
x
0
)
)
(x_0,f(x_0))
(x0,f(x0))为拐点。
Th2:(拐点的判别定理2)设
f
(
x
)
f(x)
f(x)在
x
0
x_0
x0点的某邻域内有三阶导数,且
f
′
′
(
x
)
=
0
,
f
′
′
’
(
x
)
≠
0
f''(x)=0,f''’(x)\neq0
f′′(x)=0,f′′’(x)=0,则
(
x
0
,
f
(
x
0
)
)
(x_0,f(x_0))
(x0,f(x0))为拐点。
d S = 1 + y 2 d x dS=\sqrt{1+y^2}dx dS=1+y2 dx
曲线
y
=
f
(
x
)
y=f(x)
y=f(x)在点
(
x
,
y
)
(x,y)
(x,y)处的曲率
k
=
∣
y
′
′
∣
(
1
+
y
′
2
)
3
/
2
k=\frac{\vert y''\vert}{{(1+y'^2)}^{3/2}}
k=(1+y′2)3/2∣y′′∣,对于参数方程:
{
x
=
φ
(
t
)
y
=
ψ
(
t
)
,
k
=
∣
φ
′
(
t
)
ψ
′
′
(
t
)
−
φ
′
′
(
t
)
ψ
′
(
t
)
∣
(
φ
′
2
(
t
)
+
ψ
/
′
2
(
t
)
)
3
/
2
\left\{
曲线在点 M M M处的曲率 k ( k ≠ 0 ) k(k\neq0) k(k=0)与曲线在点 M M M处的曲率半径 ρ \rho ρ有如下关系: ρ = 1 k \rho=\frac1k ρ=k1。
(1)设
A
=
(
a
i
j
)
n
×
n
A={(a_{ij})}_{n\times n}
A=(aij)n×n,则
a
i
1
A
j
1
+
a
i
2
A
j
2
+
⋯
+
a
i
n
A
j
n
=
{
∣
A
∣
,
i
=
j
0
,
i
≠
j
a_{i1}A_{j1}+a_{i2}A_{j2}+\cdots+a_{in}A_{jn}=\left\{
或
a
1
i
A
1
j
+
a
2
i
A
2
j
+
⋯
+
a
n
i
A
n
j
=
{
∣
A
∣
,
i
=
j
0
,
i
≠
j
a_{1i}A_{1j}+a_{2i}A_{2j}+\cdots+a_{ni}A_{nj}=\left\{
即
A
A
∗
=
A
∗
A
=
∣
A
∣
E
AA\ast=A\ast A=\vert A\vert E
AA∗=A∗A=∣A∣E,其中:
A
∗
=
(
A
11
A
12
⋯
A
1
n
A
21
A
22
⋯
A
2
n
⋯
⋯
⋯
⋯
A
n
1
A
n
2
⋯
A
n
n
)
=
(
A
j
i
)
=
(
A
i
j
)
T
A\ast=
D
n
=
∣
1
1
⋯
1
x
1
x
2
⋯
x
n
⋯
⋯
⋯
⋯
x
1
n
−
1
x
2
n
−
1
⋯
x
n
n
−
1
∣
=
∏
1
≤
j
≤
i
≤
n
(
x
i
−
x
j
)
D_n=
(2)设
A
,
B
A,B
A,B为
n
n
n阶方阵,则
∣
A
B
∣
=
∣
A
∣
∣
B
∣
=
∣
B
∣
∣
A
∣
|AB|=|A||B|=|B||A|
∣AB∣=∣A∣∣B∣=∣B∣∣A∣,但
∣
A
±
B
∣
=
∣
A
∣
±
∣
B
∣
|A±B|=|A|±|B|
∣A±B∣=∣A∣±∣B∣不一定成立。
(3)
∣
k
A
∣
=
k
n
∣
A
∣
|kA|=k^n|A|
∣kA∣=kn∣A∣,
A
A
A为
n
n
n阶方阵。
(4)设
A
A
A为
n
n
n阶方阵,
∣
A
T
∣
=
∣
A
∣
;
∣
A
−
1
∣
=
∣
A
∣
−
1
\vert A^T\vert=\vert A\vert;\vert A^{-1}\vert=\vert A\vert^{-1}
∣AT∣=∣A∣;∣A−1∣=∣A∣−1(若
A
A
A可逆),
∣
A
∗
∣
=
∣
A
∣
n
−
1
n
≥
2
\vert A^\ast\vert=\vert A\vert^{n-1}\;\;n\geq2
∣A∗∣=∣A∣n−1n≥2
(5)
∣
A
O
O
B
∣
=
∣
A
C
O
B
∣
=
∣
A
O
C
B
∣
=
∣
A
∣
∣
B
∣
(6)范德蒙行列式
D
n
=
∣
1
1
⋯
1
x
1
x
2
⋯
x
n
⋯
⋯
⋯
⋯
x
1
n
−
1
x
2
n
−
1
⋯
x
n
n
−
1
∣
=
∏
1
≤
j
≤
i
≤
n
(
x
i
−
x
j
)
D_n=
设
A
A
A是
n
n
n阶方阵,
λ
i
(
i
=
1
,
2
,
⋯
n
)
\lambda_i(i=1,2,\cdots n)
λi(i=1,2,⋯n)是
A
A
A的
n
n
n个特征值,则
∣
A
∣
=
∏
i
=
1
n
λ
i
\vert A\vert={\textstyle\prod_{i=1}^n}\lambda_i
∣A∣=∏i=1nλi。
矩阵:
m
×
n
m\times n
m×n个数
a
i
j
a_{ij}
aij排成
m
m
m行
n
n
n列的表格
[
a
11
a
12
⋯
a
1
n
a
21
a
22
…
a
2
n
⋮
⋮
⋱
⋮
a
m
1
a
m
2
⋯
a
m
n
]
设 A = ( a i j ) , B = ( b i j ) A=(a_{ij}),B=(b_{ij}) A=(aij),B=(bij)是两个 m × n m\times n m×n矩阵,则 m × n m\times n m×n矩阵 C = ( c i j ) = a i j + b i j C=(c_{ij})=a_{ij}+b_{ij} C=(cij)=aij+bij称为矩阵 A A A和 B B B的核,记为 A + B = C A+B=C A+B=C。
设 A = ( a i j ) A=(a_{ij}) A=(aij)是 m × n m\times n m×n矩阵, k k k是一个常数,则 m × n m\times n m×n矩阵 ( k a i j ) (ka_{ij}) (kaij)称为数 k k k与矩阵 A A A的数乘,记为 k A kA kA。
设 A = ( a i j ) A=(a_{ij}) A=(aij)是 m × n m\times n m×n矩阵,设 B = ( b i j ) B=(b_{ij}) B=(bij)是 n × s n\times s n×s矩阵,那么 m × s m\times s m×s矩阵 C = ( c i j ) C=(c_{ij}) C=(cij),其中 c i j = a i 1 b 1 j + a i 2 b 2 j + ⋯ + a i n b n j = ∑ k = 1 n a i k b k j c_{ij}=a_{i1}b_{1j}+a_{i2}b_{2j}+\cdots+a_{in}b_{nj}={\textstyle\sum_{k=1}^n}a_{ik}b_{kj} cij=ai1b1j+ai2b2j+⋯+ainbnj=∑k=1naikbkj称为 A B AB AB的乘积,记为 C = A B C=AB C=AB。
(1)
(
A
T
)
T
=
A
,
(
A
B
)
T
=
B
T
A
T
,
(
k
A
)
T
=
k
A
T
,
(
A
±
B
)
T
=
A
T
±
B
T
{(A^T)}^T=A,{(AB)}^T=B^TA^T,{(kA)}^T=kA^T,{(A\pm B)}^T=A^T\pm B^T
(AT)T=A,(AB)T=BTAT,(kA)T=kAT,(A±B)T=AT±BT
(2)
(
A
−
1
)
−
1
=
A
,
(
A
B
)
−
1
=
B
−
1
A
−
1
,
(
k
A
)
−
1
=
1
k
A
−
1
{(A^{-1})}^{-1}=A,{(AB)}^{-1}=B^{-1}A^{-1},{(kA)}^{-1}=\frac1kA^{-1}
(A−1)−1=A,(AB)−1=B−1A−1,(kA)−1=k1A−1,但
(
A
±
B
)
−
1
=
A
−
1
±
B
−
1
{(A\pm B)}^{-1}=A^{-1}\pm B^{-1}
(A±B)−1=A−1±B−1不一定成立。
(3)
(
A
∗
)
∗
=
∣
A
∣
n
−
2
A
(
n
≥
3
)
,
(
A
B
)
∗
=
B
∗
A
∗
,
(
k
A
)
∗
=
k
n
−
1
A
∗
(
n
≥
2
)
{(A^\ast)}^\ast=\vert A\vert^{n-2}A(n\geq3),{(AB)}^\ast=B^\ast A^\ast,{(kA)}^\ast=k^{n-1}A^\ast(n\geq2)
(A∗)∗=∣A∣n−2A(n≥3),(AB)∗=B∗A∗,(kA)∗=kn−1A∗(n≥2),但
(
A
±
B
)
∗
=
A
∗
±
B
∗
{(A\pm B)}^{*}=A^{*}\pm B^{*}
(A±B)∗=A∗±B∗不一定成立。
(4)
(
A
−
1
)
T
=
(
A
T
)
−
1
,
(
A
−
1
)
∗
=
(
A
A
∗
)
−
1
,
(
A
∗
)
T
=
(
A
T
)
∗
{(A^{-1})}^T={(A^T)}^{-1},{(A^{-1})}^\ast={(AA^\ast)}^{-1}{,(A^\ast)}^T={(A^T)}^\ast
(A−1)T=(AT)−1,(A−1)∗=(AA∗)−1,(A∗)T=(AT)∗。
(1)
A
A
∗
=
A
∗
A
=
∣
A
∣
E
AA^\ast=A^\ast A=\vert A\vert E
AA∗=A∗A=∣A∣E
(2)
∣
A
∗
∣
=
∣
A
∣
n
−
1
(
n
≥
2
)
,
(
k
A
)
∗
=
k
n
−
1
A
∗
,
(
A
∗
)
∗
=
∣
A
∣
n
−
2
A
(
n
≥
3
)
\vert A^\ast\vert=\vert A\vert^{n-1}(n\geq2),{(kA)}^\ast=k^{n-1}A^\ast,{(A^\ast)}^\ast=\vert A\vert^{n-2}A(n\geq3)
∣A∗∣=∣A∣n−1(n≥2),(kA)∗=kn−1A∗,(A∗)∗=∣A∣n−2A(n≥3)
(3)若
A
A
A可逆,则
A
∗
=
∣
A
∣
A
−
1
,
(
A
∗
)
∗
=
1
∣
A
∣
A
A^\ast=\vert A\vert A^{-1},{(A^\ast)}^\ast=\frac1{\vert A\vert}A
A∗=∣A∣A−1,(A∗)∗=∣A∣1A
(4)若
A
A
A为
n
n
n阶方阵,则
r
(
A
∗
)
=
{
n
,
r
(
A
)
=
n
1
,
r
(
A
)
=
n
−
1
0
,
r
(
A
)
<
n
−
1
r(A^\ast)=\left\{
(4)
(
A
−
1
)
T
=
(
A
T
)
−
1
,
(
A
−
1
)
∗
=
(
A
A
∗
)
−
1
,
(
A
∗
)
T
=
(
A
T
)
∗
{(A^{-1})}^T={(A^T)}^{-1},{(A^{-1})}^\ast={(AA^\ast)}^{-1}{,(A^\ast)}^T={(A^T)}^\ast
(A−1)T=(AT)−1,(A−1)∗=(AA∗)−1,(A∗)T=(AT)∗。
A
A
A可逆
⇔
A
A
−
1
=
E
;
⇔
∣
A
∣
≠
0
;
⇔
r
(
A
)
=
n
\Leftrightarrow AA^{-1}=E;\Leftrightarrow\vert A\vert\neq0;\Leftrightarrow r(A)=n
⇔AA−1=E;⇔∣A∣=0;⇔r(A)=n;
⇔
A
\Leftrightarrow A
⇔A可以表示为初等矩阵的乘积;
⇔
A
\Leftrightarrow A
⇔A无零特征值;
⇔
A
x
=
0
\Leftrightarrow Ax=0
⇔Ax=0只有零解。
(1)秩
r
(
A
)
r(A)
r(A)=行秩=列秩;
(2)
r
(
A
m
×
n
)
≤
m
i
n
(
m
,
n
)
r(A_{m\times n})\leq min(m,n)
r(Am×n)≤min(m,n);
(3)
A
≠
0
⇒
r
(
A
)
≥
1
A\neq0\Rightarrow r(A)\geq1
A=0⇒r(A)≥1;
(4)
r
(
A
±
B
)
≤
r
(
A
)
+
r
(
B
)
r(A\pm B)\leq r(A)+r(B)
r(A±B)≤r(A)+r(B);
(5)初等变换不改变矩阵的秩
(6)
r
(
A
)
+
r
(
B
)
−
n
≤
r
(
A
B
)
≤
m
i
n
(
r
(
A
)
,
r
(
B
)
)
r(A)+r(B)-n\leq r(AB)\leq min(r(A),r(B))
r(A)+r(B)−n≤r(AB)≤min(r(A),r(B)),特别若
A
B
=
O
AB=O
AB=O则:
r
(
A
)
+
r
(
B
)
≤
n
r(A)+r(B)\leq n
r(A)+r(B)≤n
(7)若
A
−
1
A^{-1}
A−1存在
⇒
r
(
A
B
)
=
r
(
B
)
\Rightarrow r(AB)=r(B)
⇒r(AB)=r(B);若
B
−
1
B^{-1}
B−1存在
⇒
r
(
A
B
)
=
r
(
A
)
\Rightarrow r(AB)=r(A)
⇒r(AB)=r(A);
r
(
A
m
×
n
)
=
n
⇒
r
(
A
B
)
=
r
(
B
)
r(A_{m\times n})=n\Rightarrow r(AB)=r(B)
r(Am×n)=n⇒r(AB)=r(B);
r
(
A
m
×
s
)
=
n
⇒
r
(
A
B
)
=
r
(
A
)
r(A_{m\times s})=n\Rightarrow r(AB)=r(A)
r(Am×s)=n⇒r(AB)=r(A);
(8)
r
(
A
m
×
s
)
=
n
⇔
A
x
=
0
r(A_{m\times s})=n\Leftrightarrow Ax=0
r(Am×s)=n⇔Ax=0只有零解。
(
A
O
O
B
)
−
1
=
(
A
−
1
O
O
B
−
1
)
;
(
A
C
O
B
)
−
1
=
(
A
−
1
−
A
−
1
C
B
−
1
O
B
−
1
)
;
(
A
O
C
B
)
−
1
=
(
A
−
1
O
−
B
−
1
C
A
−
1
B
−
1
)
;
(
O
A
B
O
)
−
1
=
(
O
B
−
1
A
−
1
O
)
;
这里
A
,
B
A,B
A,B均为可逆方阵。
(1)
α
1
,
α
2
,
⋯
α
s
\alpha_1,\alpha_2,\cdots\alpha_s
α1,α2,⋯αs线性相关
⇔
\Leftrightarrow
⇔至少有一个向量可以用其余向量线性表示;
(2)
α
1
,
α
2
,
⋯
α
s
\alpha_1,\alpha_2,\cdots\alpha_s
α1,α2,⋯αs线性无关,
α
1
,
α
2
,
⋯
α
s
,
β
\alpha_1,\alpha_2,\cdots\alpha_s,\beta
α1,α2,⋯αs,β线性相关
⇔
β
\Leftrightarrow\beta
⇔β可以由
α
1
,
α
2
,
⋯
α
s
\alpha_1,\alpha_2,\cdots\alpha_s
α1,α2,⋯αs唯一线性表示。
(3)
β
\beta
β可以由
α
1
,
α
2
,
⋯
α
s
\alpha_1,\alpha_2,\cdots\alpha_s
α1,α2,⋯αs线性表示
⇔
r
(
α
1
,
α
2
,
⋯
α
s
)
=
r
(
α
1
,
α
2
,
⋯
α
s
,
β
)
\Leftrightarrow r(\alpha_1,\alpha_2,\cdots\alpha_s)=r(\alpha_1,\alpha_2,\cdots\alpha_s,\beta)
⇔r(α1,α2,⋯αs)=r(α1,α2,⋯αs,β)。
(1)部分相关,整体相关;整体无关,部分无关;
(2)a.
n
n
n个
n
n
n维向量
α
1
,
α
2
,
⋯
α
n
\alpha_1,\alpha_2,\cdots\alpha_n
α1,α2,⋯αn线性无关
⇔
∣
[
α
1
,
α
2
,
⋯
α
n
]
∣
≠
0
\Leftrightarrow\vert\lbrack\alpha_1,\alpha_2,\cdots\alpha_n\rbrack\vert\neq0
⇔∣[α1,α2,⋯αn]∣=0,
n
n
n个
n
n
n维向量
α
1
,
α
2
,
⋯
α
n
\alpha_1,\alpha_2,\cdots\alpha_n
α1,α2,⋯αn线性相关
⇔
∣
[
α
1
,
α
2
,
⋯
α
n
]
∣
=
0
\Leftrightarrow\vert\lbrack\alpha_1,\alpha_2,\cdots\alpha_n\rbrack\vert=0
⇔∣[α1,α2,⋯αn]∣=0;
b.
n
+
1
n+1
n+1个
n
n
n维向量线性相关;
c.若
α
1
,
α
2
,
⋯
α
s
\alpha_1,\alpha_2,\cdots\alpha_s
α1,α2,⋯αs线性无关,则添加分量后仍线性无关;或一组向量线性相关,去掉某些分量后仍线性相关。
设
r
(
A
m
×
n
)
=
r
r(A_{m\times n})=r
r(Am×n)=r,则
A
A
A的秩
r
(
A
)
r(A)
r(A)与
A
A
A的行列向量组的线性相关性关系为:
(1)若
r
(
A
m
×
n
)
=
r
=
m
r(A_{m\times n})=r=m
r(Am×n)=r=m,则
A
A
A的行向量组线性无关;
(2)若
r
(
A
m
×
n
)
=
r
<
m
r(A_{m\times n})=r<m
r(Am×n)=r<m,则
A
A
A的行向量组线性相关;
(3)若
r
(
A
m
×
n
)
=
r
=
n
r(A_{m\times n})=r=n
r(Am×n)=r=n,则
A
A
A的列向量组线性无关;
(4)若
r
(
A
m
×
n
)
=
r
<
n
r(A_{m\times n})=r<n
r(Am×n)=r<n,则
A
A
A的列向量组线性相关;
若
α
1
,
α
2
,
⋯
α
n
\alpha_1,\alpha_2,\cdots\alpha_n
α1,α2,⋯αn与
β
1
,
β
2
,
⋯
β
n
\beta_1,\beta_2,\cdots\beta_n
β1,β2,⋯βn是向量空间
V
V
V的两组基,则基变换公式为:
(
β
1
,
β
2
,
⋯
β
n
)
=
(
α
1
,
α
2
,
⋯
α
n
)
[
c
11
c
12
⋯
c
1
n
c
21
c
22
⋯
c
2
n
⋮
⋮
⋱
⋮
c
n
1
c
n
2
⋯
c
n
n
]
=
(
α
1
,
α
2
,
⋯
α
n
)
C
(\beta_1,\beta_2,\cdots\beta_n)=(\alpha_1,\alpha_2,\cdots\alpha_n)
其中
C
C
C是可逆矩阵,称为由基
α
1
,
α
2
,
⋯
α
n
\alpha_1,\alpha_2,\cdots\alpha_n
α1,α2,⋯αn到基
β
1
,
β
2
,
⋯
β
n
\beta_1,\beta_2,\cdots\beta_n
β1,β2,⋯βn的过渡矩阵。
若向量 γ \gamma γ在基 α 1 , α 2 , ⋯ α n \alpha_1,\alpha_2,\cdots\alpha_n α1,α2,⋯αn与基 β 1 , β 2 , ⋯ β n \beta_1,\beta_2,\cdots\beta_n β1,β2,⋯βn的坐标分别是 X = ( x 1 , x 2 , ⋯ x n ) T , Y = ( y 1 , y 2 , ⋯ y n ) T X={(x_1,x_2,\cdots x_n)}^T,Y={(y_1,y_2,\cdots y_n)}^T X=(x1,x2,⋯xn)T,Y=(y1,y2,⋯yn)T,即 γ = x 1 α 1 + x 2 α 2 + ⋯ + x n α n = y 1 β 1 + y 2 β 2 + ⋯ + y n β n \gamma=x_1\alpha_1+x_2\alpha_2+\cdots+x_n\alpha_n={y_1\beta_1+y_2\beta_2+\cdots+y_n\beta_n} γ=x1α1+x2α2+⋯+xnαn=y1β1+y2β2+⋯+ynβn,则向量坐标变换公式为 X = C Y X=CY X=CY或 Y = C − 1 X Y=C^{-1}X Y=C−1X,其中 C C C是从基 α 1 , α 2 , ⋯ α n \alpha_1,\alpha_2,\cdots\alpha_n α1,α2,⋯αn到基 β 1 , β 2 , ⋯ β n \beta_1,\beta_2,\cdots\beta_n β1,β2,⋯βn的过渡矩阵。
( α , β ) = a 1 b 1 + a 2 b 2 + ⋯ + a n b n = α T β = β T α (\alpha,\beta)=a_1b_1+a_2b_2+\cdots+a_nb_n=\alpha^T\beta=\beta^T\alpha (α,β)=a1b1+a2b2+⋯+anbn=αTβ=βTα
若 α 1 , α 2 , ⋯ α s \alpha_1,\alpha_2,\cdots\alpha_s α1,α2,⋯αs线性无关,则可构造 β 1 , β 2 , ⋯ β s \beta_1,\beta_2,\cdots\beta_s β1,β2,⋯βs使其两两正交,且 β i \beta_i βi仅是 α 1 , α 2 , ⋯ α i \alpha_1,\alpha_2,\cdots\alpha_i α1,α2,⋯αi的线性组合 ( i = 1 , 2 , ⋯ , n ) (i=1,2,\cdots,n) (i=1,2,⋯,n),再把 β i \beta_i βi单位化,记 γ i = β i ∣ β i ∣ \gamma_i=\frac{\beta_i}{\vert\beta_i\vert} γi=∣βi∣βi,则 γ 1 , γ 2 , ⋯ γ i \gamma_1,\gamma_2,\cdots\gamma_i γ1,γ2,⋯γi是规范化正交向量组。其中 β 1 = α 1 , β 2 = α 2 − ( α 2 , β 1 ) ( β 1 , β 1 ) β 1 , β 3 = α 3 − ( α 3 , β 1 ) ( β 1 , β 1 ) β 1 − ( α 3 , β 2 ) ( β 2 , β 2 ) β 2 , ⋯ ⋯ β s = α s − ( α s , β 1 ) ( β 1 , β 1 ) β 1 − ( α s , β 2 ) ( β 2 , β 2 ) β 2 − ⋯ − ( α s , β s − 1 ) ( β s − 1 , β s − 1 ) β s − 1 \beta_1=\alpha_1,\beta_2=\alpha_2-\frac{(\alpha_2,\beta_1)}{(\beta_1,\beta_1)}\beta_1,\beta_3=\alpha_3-\frac{(\alpha_3,\beta_1)}{(\beta_1,\beta_1)}\beta_1-\frac{(\alpha_3,\beta_2)}{(\beta_2,\beta_2)}\beta_2,\cdots\cdots\\\beta_s=\alpha_s-\frac{(\alpha_s,\beta_1)}{(\beta_1,\beta_1)}\beta_1-\frac{(\alpha_s,\beta_2)}{(\beta_2,\beta_2)}\beta_2-\cdots-\frac{(\alpha_s,\beta_{s-1})}{(\beta_{{}_{s-1}},\beta_{s-1})}\beta_{{}_{s-1}} β1=α1,β2=α2−(β1,β1)(α2,β1)β1,β3=α3−(β1,β1)(α3,β1)β1−(β2,β2)(α3,β2)β2,⋯⋯βs=αs−(β1,β1)(αs,β1)β1−(β2,β2)(αs,β2)β2−⋯−(βs−1,βs−1)(αs,βs−1)βs−1
向量空间一组基中的向量如果两两正交,就称为正交基;若正交基中每个向量都是单位向量,就称其为规范正交基。
线性方程组
{
a
11
x
1
+
a
12
x
2
+
⋯
a
1
n
x
n
=
b
1
a
21
x
1
+
a
22
x
2
+
⋯
a
2
n
x
n
=
b
2
⋯
⋯
⋯
⋯
⋯
⋯
a
n
1
x
1
+
a
n
2
x
2
+
⋯
a
n
n
x
n
=
b
n
\left\{
n n n阶矩阵 A A A可逆 ⇔ A x = 0 \Leftrightarrow Ax=0 ⇔Ax=0只有零解 ⇔ ∀ b , A x = b \Leftrightarrow\forall b, Ax=b ⇔∀b,Ax=b总有唯一解,一般地, r ( A m × n ) = n ⇔ A x = 0 r(A_{m\times n})=n\Leftrightarrow Ax=0 r(Am×n)=n⇔Ax=0只有零解。
(1)设
A
A
A为
m
×
n
m\times n
m×n矩阵,若
r
(
A
m
×
n
)
=
m
r(A_{m\times n})=m
r(Am×n)=m,则对
A
x
=
b
Ax=b
Ax=b而言必有
r
(
A
)
=
r
(
A
⋮
b
)
=
m
r(A)=r(A\vdots b)=m
r(A)=r(A⋮b)=m,从而
A
x
=
b
Ax=b
Ax=b有解。
(2)设
x
1
,
x
2
,
⋯
x
s
x_1,x_2,\cdots x_s
x1,x2,⋯xs为
A
x
=
b
Ax=b
Ax=b的解,则
k
1
x
1
+
k
2
x
2
+
⋯
+
k
s
x
s
k_1x_1+k_2x_2+\cdots+k_sx_s
k1x1+k2x2+⋯+ksxs当
k
1
+
k
2
+
⋯
+
k
s
=
1
k_1+k_2+\cdots+k_s=1
k1+k2+⋯+ks=1时仍为
A
x
=
b
Ax=b
Ax=b的解;但当
k
1
+
k
2
+
⋯
+
k
s
=
0
k_1+k_2+\cdots+k_s=0
k1+k2+⋯+ks=0时,则为
A
x
=
0
Ax=0
Ax=0的解。特别
x
1
+
x
2
2
\frac{x_1+x_2}2
2x1+x2为
A
x
=
b
Ax=b
Ax=b的解;
2
x
3
−
(
x
1
+
x
2
)
2x_3-(x_1+x_2)
2x3−(x1+x2)为
A
x
=
0
Ax=0
Ax=0的解。
(3)非其次性方程组
A
x
=
b
Ax=b
Ax=b无解
⇔
r
(
A
)
+
1
=
r
(
A
‾
)
⇔
b
\Leftrightarrow r(A)+1=r(\overline A)\Leftrightarrow b
⇔r(A)+1=r(A)⇔b不能由
A
A
A的列向量
α
1
,
α
2
,
⋯
α
n
\alpha_1,\alpha_2,\cdots\alpha_n
α1,α2,⋯αn线性表示。
(1)齐次方程组
A
x
=
0
Ax=0
Ax=0恒有j解(必有零解)。当有非零解时,由于解向量的任意线性组合仍是该齐次方程组的解向量,因此
A
x
=
0
Ax=0
Ax=0的全体解向量构成一个向量空间,称为该方程组的解空间,解空间的维数是
n
−
r
(
A
)
n-r(A)
n−r(A),解空间的一组基称为齐次方程组的基础解系。
(2)
η
1
,
η
2
,
⋯
η
t
\eta_1,\eta_2,\cdots\eta_t
η1,η2,⋯ηt是
A
x
=
0
Ax=0
Ax=0基础解系,即:
1)
η
1
,
η
2
,
⋯
η
t
\eta_1,\eta_2,\cdots\eta_t
η1,η2,⋯ηt是
A
x
=
0
Ax=0
Ax=0的解;
2)
η
1
,
η
2
,
⋯
η
t
\eta_1,\eta_2,\cdots\eta_t
η1,η2,⋯ηt线性无关。
3)
A
x
=
0
Ax=0
Ax=0的任一解都可以由
η
1
,
η
2
,
⋯
η
t
\eta_1,\eta_2,\cdots\eta_t
η1,η2,⋯ηt线性表出,
k
1
η
1
+
k
2
η
2
+
⋯
+
k
t
η
t
k_1\eta_1+k_2\eta_2+\cdots+k_t\eta_t
k1η1+k2η2+⋯+ktηt是
A
x
=
0
Ax=0
Ax=0的通解,其中
k
1
,
k
2
,
⋯
+
k
t
k_1,k_2,\cdots+k_t
k1,k2,⋯+kt是任意常数。
(1)设
λ
\lambda
λ是
A
A
A的特征值,则
k
A
,
a
A
+
b
E
,
A
2
,
A
m
,
f
(
A
)
,
A
T
,
A
−
1
,
A
∗
kA,aA+bE,A^2,A^m,f(A),A^T,A^{-1},A^\ast
kA,aA+bE,A2,Am,f(A),AT,A−1,A∗有一个特征值分别为
k
λ
,
a
λ
+
b
,
λ
2
,
λ
m
,
f
(
λ
)
,
λ
,
λ
−
1
,
∣
A
∣
λ
k\lambda,a\lambda+b,\lambda^2,\lambda^m,f(\lambda),\lambda,\lambda^{-1},\frac{\vert A\vert}\lambda
kλ,aλ+b,λ2,λm,f(λ),λ,λ−1,λ∣A∣,且对应应特征向量相同(
A
T
A^T
AT例外)。
(2)若
λ
1
,
λ
2
,
⋯
λ
n
\lambda_1,\lambda_2,\cdots\lambda_n
λ1,λ2,⋯λn为
A
A
A的
n
n
n个特征值,则
∑
i
=
1
n
λ
i
=
∑
i
=
1
n
a
i
i
,
∏
i
=
1
n
λ
i
=
∣
A
∣
{\textstyle\sum_{i=1}^n}{\textstyle{\scriptstyle\lambda}_i}{\textstyle=}{\textstyle\sum_{i=1}^n}a_{ii},{\textstyle\prod_{i=1}^n}{\textstyle{\scriptstyle\lambda}_i}{\textstyle=}{\textstyle\vert}{\textstyle A}{\textstyle\vert}
∑i=1nλi=∑i=1naii,∏i=1nλi=∣A∣,从而
∣
A
∣
≠
0
⇔
A
\textstyle\vert A\vert\neq0\Leftrightarrow A
∣A∣=0⇔A没有特征值。
(3)设
λ
1
,
λ
2
,
⋯
λ
s
\lambda_1,\lambda_2,\cdots\lambda_s
λ1,λ2,⋯λs是
A
A
A的
s
s
s个特征值,对应特征向量为
α
1
,
α
2
,
⋯
α
s
\textstyle\alpha_1,\alpha_2,\cdots\alpha_s
α1,α2,⋯αs,若
α
=
k
1
α
1
+
k
2
α
2
+
⋯
+
k
s
α
s
\alpha=\textstyle k_1\alpha_1+k_2\alpha_2+\cdots+k_s\alpha_s
α=k1α1+k2α2+⋯+ksαs,则
A
n
=
k
1
A
n
α
1
+
k
2
A
n
α
2
+
⋯
+
k
s
A
n
α
s
=
k
1
λ
n
α
1
+
k
2
λ
n
α
2
+
⋯
+
k
s
λ
n
α
s
\textstyle A^n=k_1A^n\alpha_1+k_2A^n\alpha_2+\cdots+k_sA^n\alpha_s=k_1\lambda^n\alpha_1+k_2\lambda^n\alpha_2+\cdots+k_s\lambda^n\alpha_s
An=k1Anα1+k2Anα2+⋯+ksAnαs=k1λnα1+k2λnα2+⋯+ksλnαs。
(1)若
A
∼
B
A\sim B
A∼B,则
1)
A
T
∼
B
T
,
A
−
1
∼
B
−
1
,
A
∗
∼
B
∗
A^T\sim B^T,A^{-1}\sim B^{-1},A^\ast\sim B^\ast
AT∼BT,A−1∼B−1,A∗∼B∗
2)
∣
A
∣
∼
∣
B
∣
,
∑
i
=
1
n
A
i
i
=
∑
i
=
1
n
b
i
i
,
r
(
A
)
=
r
(
B
)
\vert A\vert\sim\vert B\vert,{\textstyle\sum_{i=1}^n}A_{ii}={\textstyle\sum_{i=1}^n}b_{ii}{\textstyle,}{\textstyle r}{\textstyle(}{\textstyle A}{\textstyle)}{\textstyle=}{\textstyle r}{\textstyle(}{\textstyle B}{\textstyle)}
∣A∣∼∣B∣,∑i=1nAii=∑i=1nbii,r(A)=r(B)
3)
∣
λ
E
−
A
∣
=
∣
λ
E
−
B
∣
\vert\lambda E-A\vert{\textstyle=}{\textstyle\vert}{\textstyle\lambda}{\textstyle E}{\textstyle-}{\textstyle B}{\textstyle\vert}
∣λE−A∣=∣λE−B∣,对
∀
λ
\textstyle\forall\lambda
∀λ成立。
(1)设
A
A
A为
n
n
n阶方阵,则
A
A
A可对角化
⇔
\textstyle\Leftrightarrow
⇔对每个
k
i
k_i
ki重根特征值
λ
i
\lambda_i
λi,有
n
−
r
(
λ
i
E
−
A
)
=
k
i
n-r(\lambda_iE-A)=k_i
n−r(λiE−A)=ki
(2)设
A
A
A可对角化,则由
P
−
1
A
P
=
Λ
P^{-1}AP=\Lambda
P−1AP=Λ,有
A
=
P
Λ
P
−
1
A=P\Lambda P^{-1}
A=PΛP−1,从而
A
n
=
P
Λ
n
P
−
1
A^n=P\Lambda^nP^{-1}
An=PΛnP−1
(3)重要结论
1)若
A
∼
B
,
C
∼
D
A\sim B,C\sim D
A∼B,C∼D,则
[
A
O
O
C
]
∼
[
B
O
O
D
]
2)若
A
∼
B
,
C
∼
D
A\sim B,C\sim D
A∼B,C∼D,则
f
(
A
)
∼
f
(
B
)
,
∣
f
(
A
)
∼
∣
f
(
B
)
∣
f(A)\sim f(B),\vert f(A)\sim\vert f(B)\vert
f(A)∼f(B),∣f(A)∼∣f(B)∣,其中
f
(
A
)
f(A)
f(A)为关
n
n
n阶方阵
A
A
A的多项式;
3)若
A
A
A为可对角化矩阵,则其非零特征数的个数(重根重复计算)=秩
A
A
A
(1)相似矩阵:设
A
、
B
A、B
A、B为两个
n
n
n阶方阵,如果存在一个可逆矩阵
P
P
P,使得
B
=
P
−
1
A
P
B=P^{-1}AP
B=P−1AP成立;
则称矩阵
A
A
A与
B
B
B相似,记为
A
∼
B
A\sim B
A∼B。
(2)相似矩阵的性质,如果
A
∼
B
A\sim B
A∼B则有:
1)
A
T
∼
B
T
A^T\sim B^T
AT∼BT
2)
A
−
1
∼
B
−
1
A^{-1}\sim B^{-1}
A−1∼B−1(若
A
、
B
A、B
A、B均可逆
3)
A
k
∼
B
k
A^k\sim B^k
Ak∼Bk(k为正整数)
4)
∣
λ
E
−
A
∣
=
∣
λ
E
−
B
∣
\vert\lambda E-A\vert{\textstyle=}{\textstyle\vert}{\textstyle\lambda}{\textstyle E}{\textstyle-}{\textstyle B}|
∣λE−A∣=∣λE−B∣,从而
A
、
B
A、B
A、B均有相同的特征值。
5)
∣
A
∣
∼
∣
B
∣
\vert A\vert\sim\vert B\vert
∣A∣∼∣B∣,从而
A
、
B
A、B
A、B同时可逆或者不可逆
6)秩
(
A
)
(A)
(A)=秩
(
B
)
(B)
(B),
∣
λ
E
−
A
∣
=
∣
λ
E
−
B
∣
\vert\lambda E-A\vert{\textstyle=}{\textstyle\vert}{\textstyle\lambda}{\textstyle E}{\textstyle-}{\textstyle B}|
∣λE−A∣=∣λE−B∣,
A
、
B
A、B
A、B不一定相似
f
(
x
1
,
x
2
,
⋯
x
n
)
=
∑
i
=
1
n
∑
j
=
1
n
a
i
j
x
i
y
j
f(x_1,x_2,\cdots x_n)={\textstyle\sum_{i=1}^n}{\textstyle\sum_{j=1}^n}a_{ij}x_iy_j
f(x1,x2,⋯xn)=∑i=1n∑j=1naijxiyj,其中
f
(
x
1
,
x
2
,
⋯
x
n
)
=
∑
i
=
1
n
∑
j
=
1
n
a
i
j
x
i
y
j
a
i
j
=
a
j
i
(
i
,
j
=
1
,
2
,
⋯
n
)
f(x_1,x_2,\cdots x_n)={\textstyle\sum_{i=1}^n}{\textstyle\sum_{j=1}^n}a_{ij}x_iy_j\\a_{ij}=a_{ji}(i,j=1,2,\cdots n)
f(x1,x2,⋯xn)=∑i=1n∑j=1naijxiyjaij=aji(i,j=1,2,⋯n),称为
n
n
n元二次型,简称二次型。若令
x
=
[
x
1
x
2
⋮
x
n
]
,
A
=
[
a
11
a
12
⋯
a
1
n
a
21
a
22
⋯
a
2
n
⋮
⋮
⋱
⋮
a
n
1
a
n
2
⋯
a
n
n
]
x=
(1)惯性定理
对于任一二次型,不论选取怎样的合同变换使它华为仅含平方项的标准型,中负惯性指数与所选变换无关,这就是所谓的惯性定理。
(2)标准形
二次型
f
=
x
T
A
x
f=x^TAx
f=xTAx经过合同变换
x
=
C
y
x=Cy
x=Cy转化为
f
=
x
T
A
x
=
y
T
C
T
A
C
f=x^TAx=y^TC^TAC
f=xTAx=yTCTAC,
y
=
∑
i
=
1
n
d
i
y
i
2
y={\textstyle\sum_{i=1}^n}d_iy_i^2
y=∑i=1ndiyi2称为
f
(
r
≤
n
)
f(r≤n)
f(r≤n)的标准形。在一般的数域n内,二次型的标准型是不唯一的,与所作的合同变换有关,但系数不为零的平方项的个数由
r
r
r(
A
A
A的秩)唯一确定。
(3)规范形
任一实二次型
f
f
f都可经过合同变换化为规范形
f
=
z
1
2
+
z
2
2
+
⋯
+
z
p
2
+
z
p
+
1
2
−
⋯
−
z
r
2
f=z_1^2+z_2^2+\cdots+z_p^2+z_{p+1}^2-\cdots-z_r^2
f=z12+z22+⋯+zp2+zp+12−⋯−zr2,其中
r
r
r为
A
A
A的秩,
p
p
p为正惯性指数,
r
−
p
r-p
r−p为负惯性指数,且规范型唯一。
(1)设
A
A
A正定
⇒
k
A
(
K
>
0
)
,
A
T
,
A
−
1
,
A
∗
\Rightarrow kA(K>0),A^T,A^{-1},A^\ast
⇒kA(K>0),AT,A−1,A∗正定;
∣
A
∣
>
0
,
A
|A|>0,A
∣A∣>0,A可逆;
a
i
i
>
0
a_{ii}>0
aii>0,且
∣
A
i
i
∣
>
0
\vert A_{ii}\vert>0
∣Aii∣>0;
(2)
A
、
B
A、B
A、B正定
⇒
A
+
B
\Rightarrow A+B
⇒A+B正定,但
A
B
,
B
A
AB,BA
AB,BA不一定正定;
(3)
A
A
A正定
⇔
f
(
x
)
=
x
T
A
x
>
0
,
∀
x
≠
0
⇔
A
\Leftrightarrow f(x)=x^TAx>0,\forall x\neq0\Leftrightarrow A
⇔f(x)=xTAx>0,∀x=0⇔A的各阶顺序主子式全大于零
⇔
A
\Leftrightarrow A
⇔A的所有特征值大于零
⇔
A
\Leftrightarrow A
⇔A的正惯性指数为
n
n
n
⇔
\Leftrightarrow
⇔存在可逆矩阵
P
P
P使
A
=
P
T
P
A=P^TP
A=PTP
⇔
\Leftrightarrow
⇔存在正交矩阵
Q
Q
Q,使
Q
T
A
Q
=
Q
−
1
A
Q
=
(
λ
1
⋱
λ
n
)
Q^TAQ=Q^{-1}AQ=
(1)子事件:
A
⊂
B
A\subset B
A⊂B,若
A
A
A发生,则
B
B
B发生。
(2)相等事件:
A
=
B
A=B
A=B,即
A
⊂
B
A\subset B
A⊂B,且
B
⊂
A
B\subset A
B⊂A。
(3)和事件:
A
∩
B
A\cap B
A∩B(或
A
+
B
A+B
A+B),
A
A
A与
B
B
B中至少有一个发生。
(4)差事件:
A
−
B
A-B
A−B,
A
A
A发生但
B
B
B不发生。
(5)积事件:
A
∩
B
A\cap B
A∩B(或
A
B
AB
AB),
A
A
A与
B
B
B同时发生。
(6)互斥事件(互不相容):
A
∩
B
=
ϕ
A\cap B=\phi
A∩B=ϕ
(7)互逆事件(对立事件):
A
∩
B
=
ϕ
,
A
∪
B
=
Ω
,
A
=
B
‾
,
B
=
A
‾
A\cap B=\phi,A\cup B=\Omega,A=\overline B,B=\overline A
A∩B=ϕ,A∪B=Ω,A=B,B=A
(1)交换律:
A
∪
B
=
B
∪
A
,
A
∩
B
=
B
∩
A
A\cup B=B\cup A,A\cap B=B\cap A
A∪B=B∪A,A∩B=B∩A
(2)结合律:
(
A
∪
B
)
∪
C
=
A
∪
(
B
∪
C
)
;
(
A
∩
B
)
∩
C
=
A
∩
(
B
∩
C
)
(A\cup B)\cup C=A\cup(B\cup C);(A\cap B)\cap C=A\cap(B\cap C)
(A∪B)∪C=A∪(B∪C);(A∩B)∩C=A∩(B∩C)
(3)分配率:
(
A
∪
B
)
∩
C
=
(
A
∩
C
)
∪
(
B
∩
C
)
(A\cup B)\cap C=(A\cap C)\cup(B\cap C)
(A∪B)∩C=(A∩C)∪(B∩C)
A ∪ B ‾ = A ‾ ∩ B ‾ A ∩ B ‾ = A ‾ ∪ B ‾ \overline{A\cup B}=\overline A\cap\overline B\;\;\;\;\overline{A\cap B}=\overline A\cup\overline B A∪B=A∩BA∩B=A∪B
A 1 , A 2 , ⋯ A n A_1,A_2,\cdots A_n A1,A2,⋯An两两互斥,且和事件为必然事件,即 A i ∩ A j = ϕ , i ≠ j , ∪ i = 1 n = Ω A_i\cap A_j=\phi,i\neq j,\overset n{\underset{i=1}\cup}=\Omega Ai∩Aj=ϕ,i=j,i=1∪n=Ω
(1)概率:事件发生的可能性大小的度量,其严格定义如下:
概率
P
(
g
)
P(g)
P(g)为定义在事件集合上的满足下面3个条件的函数:
1)对任何事件
A
,
P
(
A
)
>
0
A,P(A)>0
A,P(A)>0
2)对必然事件
Ω
,
P
(
Ω
)
=
1
\Omega, P(\Omega)=1
Ω,P(Ω)=1
3)对
A
1
,
A
2
,
⋯
A
n
A_1,A_2,\cdots A_n
A1,A2,⋯An,若
A
i
∩
A
j
=
ϕ
(
i
≠
j
)
A_i\cap A_j=\phi(i\neq j)
Ai∩Aj=ϕ(i=j),则
P
(
∪
i
=
1
∞
A
i
)
=
∑
i
=
1
∞
P
(
A
)
P(\overset\infty{\underset{i=1}\cup}A_i)={\textstyle\sum_{i=1}^\infty}P(A)
P(i=1∪∞Ai)=∑i=1∞P(A)
(2)概率的基本性质
1)
P
(
A
‾
)
=
1
−
P
(
A
)
P(\overline A)=1-P(A)
P(A)=1−P(A)
2)
P
(
A
−
B
)
=
P
(
A
)
−
P
(
A
B
)
P(A-B)=P(A)-P(AB)
P(A−B)=P(A)−P(AB)
3)
P
(
A
∪
B
)
=
P
(
A
)
+
P
(
B
)
−
P
(
A
B
)
P(A\cup B)=P(A)+P(B)-P(AB)
P(A∪B)=P(A)+P(B)−P(AB),特别,当
B
⊂
A
B\subset A
B⊂A时,
P
(
A
−
B
)
=
P
(
A
)
−
P
(
B
)
P(A-B)=P(A)-P(B)
P(A−B)=P(A)−P(B)且
P
(
B
)
⩽
P
(
A
)
;
P
(
A
∪
B
∪
C
)
=
P
(
A
)
+
P
(
B
)
+
P
(
C
)
−
P
(
A
B
)
−
P
(
B
C
)
−
P
(
A
C
)
+
P
(
A
B
C
)
P(B)\leqslant P(A);P(A\cup B\cup C)=P(A)+P(B)+P(C)-P(AB)-P(BC)-P(AC)+P(ABC)
P(B)⩽P(A);P(A∪B∪C)=P(A)+P(B)+P(C)−P(AB)−P(BC)−P(AC)+P(ABC)
4)若
A
1
,
A
2
,
⋯
A
n
A_1,A_2,\cdots A_n
A1,A2,⋯An两两互斥,则
P
(
∪
i
=
1
n
A
i
)
=
∑
i
=
1
n
P
(
A
i
)
P(\overset n{\underset{i=1}\cup}A_i)={\textstyle\sum_{i=1}^n}P(A_i)
P(i=1∪nAi)=∑i=1nP(Ai)
(3)古典型概率:实验的所有结果只有连个,且每个结果发生的可能性相同,其概率计算公式:
P
(
A
)
=
事
件
A
发
生
的
基
本
事
件
数
基
本
事
件
总
数
P(A)=\frac{\mathrm{事件}A\mathrm{发生的基本事件数}}{\mathrm{基本事件总数}}
P(A)=基本事件总数事件A发生的基本事件数
(4)几何型概率:样本空间
Ω
\Omega
Ω为欧式空间中的一个区域,且每个样本点的出现具有相等可能性,其概率计算公式:
P
(
A
)
=
A
的
度
量
(
长
度
,
体
积
,
面
积
)
Ω
的
度
量
(
长
度
,
体
积
,
面
积
)
P(A)=\frac{A\mathrm{的度量}(\mathrm{长度},\mathrm{体积},\mathrm{面积})}{\Omega\mathrm{的度量}(\mathrm{长度},\mathrm{体积},\mathrm{面积})}
P(A)=Ω的度量(长度,体积,面积)A的度量(长度,体积,面积)
(1)条件概率:
P
(
B
∣
A
)
=
P
(
A
B
)
P
(
A
)
P(B\vert A)=\frac{P(AB)}{P(A)}
P(B∣A)=P(A)P(AB),表示
A
A
A发生的概率下,
B
B
B发生的概率
(2)全概率公式:
P
(
A
)
=
∑
i
=
1
n
P
(
A
∣
B
i
)
P
(
B
i
)
,
B
i
B
j
=
∅
,
i
≠
j
,
⋃
i
=
1
n
B
i
=
Ω
.
P(A)={\textstyle\sum_{i=1}^n}P(A\vert B_i)P(B_i),B_iB_j=\varnothing,i\neq j,\bigcup_{i=1}^nB_i=\Omega.
P(A)=∑i=1nP(A∣Bi)P(Bi),BiBj=∅,i=j,⋃i=1nBi=Ω.
(3)贝叶斯公式:
P
(
B
j
∣
A
)
=
P
(
A
∣
B
j
)
P
(
B
j
)
∑
i
=
1
n
P
(
A
∣
B
i
)
P
(
B
i
)
,
j
=
1
,
2
⋯
n
P(B_j\vert A)=\frac{P(A\vert B_j)P(B_j)}{\sum_{i=1}^nP(A\vert B_i)P(B_i)},j=1,2\cdots n
P(Bj∣A)=∑i=1nP(A∣Bi)P(Bi)P(A∣Bj)P(Bj),j=1,2⋯n
注:上述公式中事件
B
i
B_i
Bi的个数可为可列个。
(4)乘法公式:
P
(
A
1
A
2
)
=
P
(
A
1
)
P
(
A
2
∣
A
1
)
=
P
(
A
2
)
P
(
A
1
∣
A
2
)
P(A_1A_2)=P(A_1)P(A_2\vert A_1)=P(A_2)P(A_1\vert A_2)
P(A1A2)=P(A1)P(A2∣A1)=P(A2)P(A1∣A2)
P
(
A
1
A
2
⋯
A
n
)
=
P
(
A
1
)
P
(
A
2
∣
A
1
)
P
(
A
3
∣
A
1
A
2
)
⋯
P
(
A
n
)
P
(
A
1
A
2
⋯
A
n
−
1
)
P(A_1A_2\cdots A_n)=P(A_1)P(A_2\vert A_1)P(A_3\vert A_1A_2)\cdots P(A_n)P(A_1A_2\cdots A_{n-1})
P(A1A2⋯An)=P(A1)P(A2∣A1)P(A3∣A1A2)⋯P(An)P(A1A2⋯An−1)
(1)
A
A
A与
B
B
B相互独立
⇔
P
(
A
B
)
=
P
(
A
)
P
(
B
)
\Leftrightarrow P(AB)=P(A)P(B)
⇔P(AB)=P(A)P(B)
(2)
A
,
B
,
C
A,B,C
A,B,C两两独立
⇔
P
(
A
B
)
=
P
(
A
)
P
(
B
)
;
P
(
B
C
)
=
P
(
B
)
P
(
C
)
;
P
(
A
C
)
=
P
(
A
)
P
(
C
)
\Leftrightarrow P(AB)=P(A)P(B);P(BC)=P(B)P(C);P(AC)=P(A)P(C)
⇔P(AB)=P(A)P(B);P(BC)=P(B)P(C);P(AC)=P(A)P(C)
(3)
A
,
B
,
C
A,B,C
A,B,C相互独立
⇔
P
(
A
B
)
=
P
(
A
)
P
(
B
)
;
P
(
B
C
)
=
P
(
B
)
P
(
C
)
;
P
(
A
C
)
=
P
(
A
)
P
(
C
)
;
P
(
A
B
C
)
=
P
(
A
)
P
(
B
)
P
(
C
)
\Leftrightarrow P(AB)=P(A)P(B);P(BC)=P(B)P(C);P(AC)=P(A)P(C);P(ABC)=P(A)P(B)P(C)
⇔P(AB)=P(A)P(B);P(BC)=P(B)P(C);P(AC)=P(A)P(C);P(ABC)=P(A)P(B)P(C)
将某实验独立重复 n n n次,若每次实验中事件 A A A发生的概率为 p p p,则 n n n次实验中 A A A发生 k k k次的概率为: P ( X = k ) = C n k p k ( 1 − p ) n − k P(X=k)=C_n^kp^k{(1-p)}^{n-k} P(X=k)=Cnkpk(1−p)n−k
(1)
P
(
A
‾
)
=
1
−
P
(
A
)
P(\overline A)=1-P(A)
P(A)=1−P(A)
(2)
P
(
A
∪
B
)
=
P
(
A
)
+
P
(
B
)
−
P
(
A
B
)
P
(
A
∪
B
∪
C
)
=
P
(
A
)
+
P
(
B
)
+
P
(
C
)
−
P
(
A
B
)
−
P
(
B
C
)
−
P
(
A
C
)
+
P
(
A
B
C
)
P(A\cup B)=P(A)+P(B)-P(AB)\\P(A\cup B\cup C)=P(A)+P(B)+P(C)-P(AB)-P(BC)-P(AC)+P(ABC)
P(A∪B)=P(A)+P(B)−P(AB)P(A∪B∪C)=P(A)+P(B)+P(C)−P(AB)−P(BC)−P(AC)+P(ABC)
(3)
P
(
A
−
B
)
=
P
(
A
)
−
P
(
A
B
)
P(A-B)=P(A)-P(AB)
P(A−B)=P(A)−P(AB)
(4)
P
(
A
B
‾
)
=
1
−
P
(
A
B
)
,
P
(
A
)
=
P
(
A
B
)
+
P
(
A
B
‾
)
,
P
(
A
∪
B
)
=
P
(
A
)
+
P
(
A
‾
B
)
=
P
(
A
B
)
+
P
(
A
B
‾
)
+
P
(
A
‾
B
)
P(A\overline B)=1-P(AB),P(A)=P(AB)+P(A\overline B),P(A\cup B)=P(A)+P(\overline AB)=P(AB)+P(A\overline B)+P(\overline AB)
P(AB)=1−P(AB),P(A)=P(AB)+P(AB),P(A∪B)=P(A)+P(AB)=P(AB)+P(AB)+P(AB)
(5)条件概率
P
(
⋅
∣
B
)
P(\cdot |B)
P(⋅∣B)满足概率的所有性质。例如:
P
(
A
1
‾
∣
B
)
=
1
−
P
(
A
1
∣
B
)
P
(
A
1
∪
A
2
∣
B
)
=
P
(
A
1
∣
B
)
+
P
(
A
2
∣
B
)
−
P
(
A
1
A
2
∣
B
)
P
(
A
1
A
2
∣
B
)
=
P
(
A
1
∣
B
)
P
(
A
2
∣
A
1
B
)
P(\overline{A_1}\vert B)=1-P(A_1\vert B)\\P(A_1\cup A_2\vert B)=P(A_1\vert B)+P(A_2\vert B)-P(A_1A_2\vert B)\\P(A_1A_2\vert B)=P(A_1\vert B)P(A_2\vert A_1B)
P(A1∣B)=1−P(A1∣B)P(A1∪A2∣B)=P(A1∣B)+P(A2∣B)−P(A1A2∣B)P(A1A2∣B)=P(A1∣B)P(A2∣A1B)
(6)若
A
1
,
A
2
,
⋯
A
n
A_1,A_2,\cdots A_n
A1,A2,⋯An相互独立,则
A
i
∩
A
j
=
ϕ
(
i
≠
j
)
A_i\cap A_j=\phi(i\neq j)
Ai∩Aj=ϕ(i=j),则
P
(
∩
i
=
1
n
A
i
)
=
∏
i
=
1
n
P
(
A
i
)
,
P
(
∪
i
=
1
n
A
i
)
=
∏
i
=
1
n
(
1
−
P
(
A
i
)
)
P(\cap_{i=1}^nA_i)={\textstyle\prod_{i=1}^n}P(A_i),P(\cup_{i=1}^nA_i)={\textstyle\prod_{i=1}^n(1-}P(A_i))
P(∩i=1nAi)=∏i=1nP(Ai),P(∪i=1nAi)=∏i=1n(1−P(Ai))
(7)互斥、互逆与独立性之间的关系:
A
A
A与
B
B
B互逆
⇒
A
\Rightarrow A
⇒A与
B
B
B互斥,但反之不成立,
A
A
A与
B
B
B互斥(或互逆)且均非零概况事件
⇒
A
\Rightarrow A
⇒A与
B
B
B不独立。
(8)若
A
1
,
A
2
,
⋯
A
n
,
B
1
,
B
2
,
⋯
B
n
A_1,A_2,\cdots A_n,B_1,B_2,\cdots B_n
A1,A2,⋯An,B1,B2,⋯Bn相互独立,则
f
(
A
1
,
A
2
,
⋯
A
n
)
f(A_1,A_2,\cdots A_n)
f(A1,A2,⋯An)与
g
(
B
1
,
B
2
,
⋯
B
n
)
g(B_1,B_2,\cdots B_n)
g(B1,B2,⋯Bn)也相互独立,其中
f
(
⋅
)
f(\cdot )
f(⋅),
g
(
⋅
)
g(\cdot )
g(⋅)分别表示对相应事件做任一事件运算后所得的时间,另外,概率为1(或0)的时间与任何事件相互独立。
取值带有随机性的变量,严格地u哦是定义在样本空间个,取值于实数的函数称为随机变量,概率分布通常指分布函数或分布律。
定义:
F
(
x
)
=
P
(
X
⩽
x
)
,
−
∞
<
x
<
+
∞
F(x)=P(X\leqslant x),-\infty<x<+\infty
F(x)=P(X⩽x),−∞<x<+∞
性质:(1)
0
⩽
F
(
x
)
⩽
1
0\leqslant F(x)\leqslant1\;\;\;\;\;\;\;
0⩽F(x)⩽1 (2)
F
(
x
)
F(x)
F(x)单调不减
(3)右连续
F
(
x
+
0
)
=
F
(
x
)
F(x+0)=F(x)\;\;
F(x+0)=F(x)(3)
F
(
−
∞
)
=
0
,
F
(
+
∞
)
=
1
F(-\infty)=0,F(+\infty)=1
F(−∞)=0,F(+∞)=1
P ( X = x i ) = p i , i = 1 , 2 , ⋯ n , ⋯ p i ⩾ 0 , ∑ i = 1 n p i = 1 P(X=x_i)=p_i,i=1,2,\cdots n,\cdots\;\;\;\;\;\;p_i\geqslant0,{\textstyle\sum_{i=1}^n}p_i=1 P(X=xi)=pi,i=1,2,⋯n,⋯pi⩾0,∑i=1npi=1
概率密度 f ( x ) f(x) f(x),且:(1) f ( x ) ⩾ 0 f(x)\geqslant0 f(x)⩾0,(2) ∫ − ∞ + ∞ f ( x ) d x ⩾ 1 \int_{-\infty}^{+\infty}f(x)\operatorname dx\geqslant1 ∫−∞+∞f(x)dx⩾1,(3) x x x为 f ( x ) f(x) f(x)的连续点,则f(x)=F’(x)分布函数 F ( x ) = ∫ − ∞ x f ( t ) d t F(x)=\int_{-\infty}^xf(t)\operatorname dt F(x)=∫−∞xf(t)dt
(1)0-1分布:
P
(
X
=
k
)
=
p
k
(
1
−
p
)
k
,
k
=
0
,
1
P(X=k)=p^k{(1-p)}^k,k=0,1
P(X=k)=pk(1−p)k,k=0,1
(2)二项分布:
B
(
n
,
p
)
:
P
(
X
=
k
)
=
C
n
k
p
k
(
1
−
p
)
n
−
k
,
k
=
0
,
1
,
⋯
,
n
B(n,p):P(X=k)=C_n^kp^k{(1-p)}^{n-k},k=0,1,\cdots,n
B(n,p):P(X=k)=Cnkpk(1−p)n−k,k=0,1,⋯,n
(3)Poisson分布:
p
(
λ
)
:
P
(
X
=
k
)
=
λ
k
k
!
e
−
λ
,
λ
>
0
,
k
=
0
,
1
,
2
⋯
p(\lambda):P(X=k)=\frac{\lambda^k}{k!}e^{-\lambda},\lambda>0,k=0,1,2\cdots
p(λ):P(X=k)=k!λke−λ,λ>0,k=0,1,2⋯
(4)均与分布
U
(
a
,
b
)
:
f
(
x
)
=
{
1
b
−
a
,
a
<
x
<
b
0
U(a,b):f(x)=\left\{
(5)正态分布:
N
(
μ
,
σ
2
)
:
φ
(
x
)
=
1
2
π
σ
e
−
(
x
−
μ
)
2
2
σ
2
,
σ
>
0
,
−
∞
<
x
<
+
∞
N(\mu,\sigma^2):\varphi(x)=\frac1{\sqrt{2\pi}\sigma}e^{-\frac{{(x-\mu)}^2}{2\sigma^2}},\sigma>0,-\infty<x<+\infty
N(μ,σ2):φ(x)=2π
σ1e−2σ2(x−μ)2,σ>0,−∞<x<+∞
(6)指数分布:
E
(
λ
)
:
f
(
x
)
=
{
λ
e
−
λ
x
,
x
>
0
,
λ
>
0
0
E(\lambda):f(x)=\left\{
(7)几何分布:
G
(
p
)
:
P
(
X
=
k
)
=
(
1
−
p
)
k
−
1
p
,
0
<
p
<
1
,
k
=
1
,
2
,
⋯
G(p):P(X=k)={(1-p)}^{k-1}p,0<p<1,k=1,2,\cdots
G(p):P(X=k)=(1−p)k−1p,0<p<1,k=1,2,⋯
(8)超几何分布:
H
(
N
,
M
,
n
)
:
P
(
X
=
k
)
=
C
M
k
C
N
−
M
n
−
k
C
N
n
,
k
=
0
,
1
,
⋯
,
m
i
n
(
n
,
M
)
H(N,M,n):P(X=k)=\frac{C_M^kC_{N-M}^{n-k}}{C_N^n},k=0,1,\cdots,min(n,M)
H(N,M,n):P(X=k)=CNnCMkCN−Mn−k,k=0,1,⋯,min(n,M)
(1)离散型:
P
(
X
=
x
1
)
=
p
i
,
Y
=
g
(
X
)
P(X=x_1)=p_i,Y=g(X)
P(X=x1)=pi,Y=g(X),则:
P
(
X
=
x
j
)
=
∑
g
(
x
i
)
=
y
i
P
(
X
=
x
i
)
P(X=x_j)={\textstyle\sum_{g(x_i)=y_i}}P(X=x_i)
P(X=xj)=∑g(xi)=yiP(X=xi)
(2)连续型:
X
∼
f
x
(
x
)
,
Y
=
g
(
x
)
X\sim f_x(x),Y=g(x)
X∼fx(x),Y=g(x),则:
F
Y
(
y
)
=
P
(
Y
≤
y
)
=
P
(
g
(
X
)
≤
y
)
=
∫
g
(
x
)
≤
y
f
X
(
x
)
d
x
,
f
Y
(
y
)
=
F
y
′
(
y
)
F_Y(y)=P(Y\leq y)=P(g(X)\leq y)=\int_{g(x)\leq y}f_X(x)dx,f_Y(y)=F_y^{'}(y)
FY(y)=P(Y≤y)=P(g(X)≤y)=∫g(x)≤yfX(x)dx,fY(y)=Fy′(y)
(1)
X
∼
N
(
0
,
1
)
⇒
φ
(
0
)
=
1
2
π
,
Φ
(
0
)
=
1
2
,
Φ
(
−
a
)
=
P
(
X
≤
−
a
)
=
1
−
Φ
(
a
)
X\sim N(0,1)\Rightarrow\varphi(0)=\frac1{\sqrt{2\pi}},\Phi(0)=\frac12,\Phi(-a)=P(X\leq-a)=1-\Phi(a)
X∼N(0,1)⇒φ(0)=2π
1,Φ(0)=21,Φ(−a)=P(X≤−a)=1−Φ(a)
(2)
X
∼
N
(
μ
,
σ
2
)
⇒
X
−
μ
σ
∼
N
(
0
,
1
)
,
P
(
X
≤
a
)
=
Φ
(
a
−
μ
σ
)
X\sim N(\mu,\sigma^2)\Rightarrow\frac{X-\mu}\sigma\sim N(0,1),P(X\leq a)=\Phi(\frac{a-\mu}\sigma)
X∼N(μ,σ2)⇒σX−μ∼N(0,1),P(X≤a)=Φ(σa−μ)
(3)
X
∼
E
(
λ
)
⇒
p
(
X
>
s
+
t
∣
X
>
s
)
=
P
(
X
>
t
)
X\sim E(\lambda)\Rightarrow p(X>s+t\vert X>s)=P(X>t)
X∼E(λ)⇒p(X>s+t∣X>s)=P(X>t)
(4)
X
∼
G
(
p
)
⇒
p
(
X
=
m
+
k
∣
X
>
m
)
=
P
(
X
=
k
)
X\sim G(p)\Rightarrow p(X=m+k\vert X>m)=P(X=k)
X∼G(p)⇒p(X=m+k∣X>m)=P(X=k)
(5)离散型随机变量的分布函数为阶梯间断函数:连续型随机变量的分布函数为连续函数,但不一定为处处可导函数。
(6)存在既非离散也非连续型随机变量。
由两个随机变量构成的随机向量 ( X , Y ) (X,Y) (X,Y),联合分布为 F ( x , y ) = P ( X ≤ x , Y ≤ y ) F(x,y)=P(X\leq x,Y\leq y) F(x,y)=P(X≤x,Y≤y)
(1)联合概率分布律
P
{
X
=
x
i
,
Y
=
y
j
}
=
p
i
j
,
i
,
j
=
1
,
2
,
⋯
P\{X=x_i,Y=y_j\}=p_{ij},i,j=1,2,\cdots
P{X=xi,Y=yj}=pij,i,j=1,2,⋯
(2)边缘分布律
p
i
⋅
=
∑
j
=
1
∞
p
i
j
,
i
=
1
,
2
⋯
p
⋅
j
=
∑
i
=
1
∞
p
i
j
,
j
=
1
,
2
⋯
p_{i\cdot}={\textstyle\sum_{j=1}^\infty}p_{ij},i=1,2\cdots\;\;p_{\cdot j}={\textstyle\sum_{i=1}^\infty}p_{ij},j=1,2\cdots
pi⋅=∑j=1∞pij,i=1,2⋯p⋅j=∑i=1∞pij,j=1,2⋯
(3)条件分布律
P
{
X
=
x
i
∣
Y
=
y
j
}
=
p
i
j
p
⋅
j
P
{
Y
=
y
∣
j
X
=
x
i
}
=
p
i
j
p
i
⋅
P\{X=x_i\vert Y=y_j\}=\frac{p_{ij}}{p_{\cdot j}}\;\;P\{Y=y\vert_jX=x_i\}=\frac{p_{ij}}{p_{i\cdot}}
P{X=xi∣Y=yj}=p⋅jpijP{Y=y∣jX=xi}=pi⋅pij
(1)联合概率分布
f
(
x
,
y
)
:
f(x,y):
f(x,y):
1)
f
(
x
,
y
)
≥
0
f(x,y)\geq0\;\;\;\;\;
f(x,y)≥0 2)
∫
−
∞
+
∞
f
(
x
,
y
)
d
x
d
y
=
1
\int_{-\infty}^{+\infty}{f(x,y)}\operatorname dxdy=1
∫−∞+∞f(x,y)dxdy=1
(2)分布函数
F
(
x
,
y
)
=
∫
−
∞
x
∫
−
∞
y
f
(
u
,
v
)
d
u
d
v
F(x,y)=\int_{-\infty}^x{\int_{-\infty}^yf(u,v)}\operatorname dudv
F(x,y)=∫−∞x∫−∞yf(u,v)dudv
(3)边缘概率密度:
f
X
(
x
)
=
∫
−
∞
+
∞
f
(
x
,
y
)
d
y
f
Y
(
y
)
=
∫
−
∞
+
∞
f
(
x
,
y
)
d
x
f_X(x)=\int_{-\infty}^{+\infty}{f(x,y)}\operatorname dy\;\;\;f_Y(y)=\int_{-\infty}^{+\infty}{f(x,y)}\operatorname dx
fX(x)=∫−∞+∞f(x,y)dyfY(y)=∫−∞+∞f(x,y)dx
(4)条件概率密度:
f
X
∣
Y
(
x
∣
y
)
=
f
(
x
,
y
)
f
Y
(
y
)
f
Y
∣
X
(
y
∣
x
)
=
f
(
x
,
y
)
f
X
(
x
)
f_{X\vert Y}(x\vert y)=\frac{f(x,y)}{f_Y(y)}\;\;\;\;f_{Y\vert X}(y\vert x)=\frac{f(x,y)}{f_X(x)}
fX∣Y(x∣y)=fY(y)f(x,y)fY∣X(y∣x)=fX(x)f(x,y)
(1)二维均匀分布:
(
x
,
y
)
∼
U
(
D
)
,
f
(
x
,
y
)
=
{
1
S
(
D
)
,
(
x
,
y
)
∈
D
0
,
其
他
(x,y)\sim U(D),f(x,y)=\left\{
(2)二维正态分布:
(
X
,
Y
)
∼
N
(
μ
1
,
μ
2
,
σ
1
2
,
σ
2
2
,
ρ
)
(X,Y)\sim N(\mu_1,\mu_2,\sigma_1^2,\sigma_2^2,\rho)
(X,Y)∼N(μ1,μ2,σ12,σ22,ρ)
f
(
x
,
y
)
=
1
2
π
σ
1
σ
2
1
−
ρ
2
⋅
e
x
p
{
−
1
2
(
1
−
ρ
2
)
[
(
x
−
μ
1
)
2
σ
1
2
−
2
ρ
(
x
−
μ
1
)
σ
1
(
y
−
μ
2
)
σ
2
+
(
y
−
μ
2
)
2
σ
2
2
]
}
f(x,y)=\frac1{2\pi\sigma_1\sigma_2\sqrt{1-\rho^2}}\cdot exp\left\{\frac{-1}{2(1-\rho^2)}\left[\frac{{(x-\mu_1)}^2}{\sigma_1^2}-2\rho\frac{(x-\mu_1)}{\sigma_1}\frac{(y-\mu_2)}{\sigma_2}+\frac{{(y-\mu_2)}^2}{\sigma_2^2}\right]\right\}
f(x,y)=2πσ1σ21−ρ2
1⋅exp{2(1−ρ2)−1[σ12(x−μ1)2−2ρσ1(x−μ1)σ2(y−μ2)+σ22(y−μ2)2]}
X
X
X和
Y
Y
Y相互独立
⇔
F
(
x
,
y
)
=
F
X
(
x
)
F
Y
(
y
)
⇔
p
i
j
=
p
i
⋅
p
⋅
j
(
离
散
型
)
⇔
f
(
x
,
y
)
=
f
X
(
x
)
f
Y
(
y
)
(
连
续
型
)
\Leftrightarrow F(x,y)=F_X(x)F_Y(y)\Leftrightarrow p_{ij}=p_{i\cdot}p_{\cdot j}(\mathrm{离散型})\Leftrightarrow f(x,y)=f_X(x)f_Y(y)(\mathrm{连续型})
⇔F(x,y)=FX(x)FY(y)⇔pij=pi⋅p⋅j(离散型)⇔f(x,y)=fX(x)fY(y)(连续型)
X
X
X和
Y
Y
Y的相关性:相关系数
ρ
X
Y
=
0
\rho_{XY}=0
ρXY=0时,称
X
X
X和
Y
Y
Y不相关,否则称
X
X
X和
Y
Y
Y相关。
离散型:
P
(
X
=
x
i
,
Y
=
y
j
)
=
p
i
j
,
Z
=
g
(
X
,
Y
)
P(X=x_i,Y=y_j)=p_{ij},Z=g(X,Y)
P(X=xi,Y=yj)=pij,Z=g(X,Y),则:
P
(
Z
=
z
k
)
=
P
{
g
(
X
,
Y
=
z
k
}
=
∑
g
(
x
i
,
y
i
)
=
z
k
P
(
X
=
x
i
,
Y
=
y
j
)
P(Z=z_k)=P\left\{g(X,Y=z_k\right\}={\textstyle\sum_{g(x_i,y_i)=z_k}}P(X=x_i,Y=y_j)
P(Z=zk)=P{g(X,Y=zk}=∑g(xi,yi)=zkP(X=xi,Y=yj)
连续型:
(
X
,
Y
)
∼
f
(
x
,
y
)
,
Z
=
g
(
X
,
Y
)
(X,Y)\sim f(x,y),Z=g(X,Y)
(X,Y)∼f(x,y),Z=g(X,Y),则:
F
z
(
Z
)
=
P
{
g
(
X
,
Y
)
≤
z
}
=
∬
g
(
x
,
y
)
≤
z
f
(
x
,
y
)
d
x
d
y
,
f
z
(
Z
)
=
F
z
′
(
Z
)
F_z(Z)=P\left\{g(X,Y)\leq z\right\}=\iint_{g(x,y)\leq z}f(x,y)dxdy,f_z(Z)=F'_z(Z)
Fz(Z)=P{g(X,Y)≤z}=∬g(x,y)≤zf(x,y)dxdy,fz(Z)=Fz′(Z)
(1)边缘密度公式:
F
X
(
x
)
=
∫
−
∞
+
∞
f
(
x
,
y
)
d
y
,
F
Y
(
y
)
=
∫
−
∞
+
∞
f
(
x
,
y
)
d
x
F_X(x)=\int_{-\infty}^{+\infty}f(x,y)\operatorname dy,F_Y(y)=\int_{-\infty}^{+\infty}f(x,y)\operatorname dx
FX(x)=∫−∞+∞f(x,y)dy,FY(y)=∫−∞+∞f(x,y)dx
(2)
P
{
(
X
,
Y
)
∈
D
}
=
∬
D
f
(
x
,
y
)
d
x
d
y
P\left\{(X,Y)\in D\right\}=\iint_Df(x,y)dxdy
P{(X,Y)∈D}=∬Df(x,y)dxdy
(3)若
(
X
,
Y
)
(X,Y)
(X,Y)服从二维正态分布
N
(
μ
1
,
μ
2
,
σ
1
2
,
σ
2
2
,
ρ
)
N(\mu_1,\mu_2,\sigma_1^2,\sigma_2^2,\rho)
N(μ1,μ2,σ12,σ22,ρ) ,则有:
1)
X
∼
N
(
μ
1
,
σ
1
2
)
,
Y
∼
N
(
μ
2
,
σ
2
2
)
X\sim N(\mu_1,\sigma_1^2),Y\sim N(\mu_2,\sigma_2^2)
X∼N(μ1,σ12),Y∼N(μ2,σ22)
2)
X
X
X与
Y
Y
Y相互独立
⇔
ρ
=
0
\Leftrightarrow\rho=0
⇔ρ=0,即
X
X
X与
Y
Y
Y不相关。
3)
C
1
X
+
C
2
Y
∼
N
(
C
1
μ
1
+
C
2
μ
2
,
C
1
2
σ
1
2
+
C
2
2
σ
2
2
+
2
C
1
C
2
σ
1
σ
2
ρ
)
C_1X+C_2Y\sim N(C_1\mu_1+C_2\mu_2,C_1^2\sigma_1^2+C_2^2\sigma_2^2+2C_1C_2\sigma_1\sigma_2\rho)
C1X+C2Y∼N(C1μ1+C2μ2,C12σ12+C22σ22+2C1C2σ1σ2ρ)
4)
X
X
X关于
Y
=
y
Y=y
Y=y的条件分布为:
N
(
μ
1
+
ρ
σ
1
σ
2
(
y
−
μ
2
)
,
σ
1
2
(
1
−
ρ
2
)
)
N(\mu_1+\rho\frac{\sigma_1}{\sigma_2}(y-\mu_2),\sigma_1^2(1-\rho^2))
N(μ1+ρσ2σ1(y−μ2),σ12(1−ρ2))
4)
Y
Y
Y关于
X
=
x
X=x
X=x的条件分布为:
N
(
μ
2
+
ρ
σ
2
σ
1
(
y
−
μ
1
)
,
σ
2
2
(
1
−
ρ
2
)
)
N(\mu_2+\rho\frac{\sigma_2}{\sigma_1}(y-\mu_1),\sigma_2^2(1-\rho^2))
N(μ2+ρσ1σ2(y−μ1),σ22(1−ρ2))
(4)若
X
X
X与
Y
Y
Y独立,且分别服从
N
(
μ
1
,
σ
1
2
)
,
N
(
μ
2
,
σ
2
2
)
N(\mu_1,\sigma_1^2),N(\mu_2,\sigma_2^2)
N(μ1,σ12),N(μ2,σ22),则:
(
X
,
Y
)
∼
N
(
μ
1
,
μ
2
,
σ
1
2
,
σ
2
2
,
0
)
,
C
1
X
+
C
2
Y
∼
N
(
C
1
μ
1
+
C
2
μ
2
,
C
1
2
σ
1
2
+
C
2
2
σ
2
2
)
(X,Y)\sim N(\mu_1,\mu_2,\sigma_1^2,\sigma_2^2,0) ,C_1X+C_2Y\sim N(C_1\mu_1+C_2\mu_2,C_1^2\sigma_1^2+C_2^2\sigma_2^2)
(X,Y)∼N(μ1,μ2,σ12,σ22,0),C1X+C2Y∼N(C1μ1+C2μ2,C12σ12+C22σ22)(5)若
X
X
X与
Y
Y
Y相互独立,
f
(
x
)
f(x)
f(x)和
g
(
x
)
g(x)
g(x)为连续函数,则
f
(
X
)
f(X)
f(X)和
g
(
Y
)
g(Y)
g(Y)也相互独立。
离散型:
P
{
X
=
x
i
}
=
p
i
,
E
(
X
)
=
∑
i
x
i
p
i
P\left\{X=x_i\right\}=p_i,E(X)={\textstyle\sum_{{}_i}}x_ip_i
P{X=xi}=pi,E(X)=∑ixipi
连续型:
X
∼
f
(
x
)
,
E
(
X
)
=
∫
−
∞
+
∞
x
f
(
x
)
d
x
X\sim f(x),E(X)=\int_{-\infty}^{+\infty}xf(x)\operatorname dx
X∼f(x),E(X)=∫−∞+∞xf(x)dx
性质:
(1)
E
(
C
)
=
C
,
E
[
E
(
X
)
]
=
E
(
X
)
E(C)=C,E\left[E(X)\right]=E(X)
E(C)=C,E[E(X)]=E(X)
(2)
E
(
C
1
X
+
C
2
Y
)
=
C
1
E
(
X
)
+
C
2
E
(
Y
)
E(C_1X+C_2Y)=C_1E(X)+C_2E(Y)
E(C1X+C2Y)=C1E(X)+C2E(Y)
(3)若
X
X
X和
Y
Y
Y独立,则
E
(
X
Y
)
=
E
(
X
)
E
(
Y
)
E(XY)=E(X)E(Y)
E(XY)=E(X)E(Y)
(4)
[
E
(
X
Y
)
]
2
≤
E
(
X
2
)
E
(
Y
2
)
\left[E(XY)\right]^2\leq E(X^2)E(Y^2)
[E(XY)]2≤E(X2)E(Y2)
方差:
D
(
X
)
=
E
[
X
−
E
(
X
)
]
2
=
E
(
X
2
)
−
[
E
(
X
)
]
2
D(X)=E\left[X-E(X)\right]^2=E(X^2)-{\lbrack E(X)\rbrack}^2\;
D(X)=E[X−E(X)]2=E(X2)−[E(X)]2
标准差:
D
(
X
)
\sqrt{D(X)}
D(X)
离散型:
D
(
X
)
=
∑
i
[
x
i
−
E
(
X
)
]
2
p
i
D(X)={\textstyle\sum_i}\left[x_i-E(X)\right]^2p_i
D(X)=∑i[xi−E(X)]2pi
连续型:
D
(
X
)
=
∫
−
∞
+
∞
[
x
−
E
(
X
)
]
2
f
(
x
)
d
x
D(X)=\int_{-\infty}^{+\infty}\left[x-E(X)\right]^2f(x)\operatorname dx
D(X)=∫−∞+∞[x−E(X)]2f(x)dx
性质:
(1)
D
(
C
)
=
0
,
D
[
E
(
X
)
]
=
0
,
D
[
D
(
X
)
]
=
0
D(C)=0,D[E(X)]=0,D[D(X)]=0
D(C)=0,D[E(X)]=0,D[D(X)]=0
(2)
X
X
X与
Y
Y
Y相互独立,则
D
(
X
±
Y
)
=
D
(
X
)
+
D
(
Y
)
D(X±Y)=D(X)+D(Y)
D(X±Y)=D(X)+D(Y)
(3)
D
(
C
1
X
+
C
2
)
=
C
1
2
D
(
X
)
D(C_1X+C_2)=C_1^2D(X)
D(C1X+C2)=C12D(X)
(4)一般有
D
(
X
±
y
)
=
D
(
X
)
+
D
(
Y
)
±
2
C
o
v
(
X
,
Y
)
=
D
(
X
)
+
D
(
Y
)
±
ρ
D
(
X
)
D
(
Y
)
D(X\pm y)=D(X)+D(Y)\pm2Cov(X,Y)=D(X)+D(Y)\pm\rho\sqrt{D(X)}\sqrt{D(Y)}
D(X±y)=D(X)+D(Y)±2Cov(X,Y)=D(X)+D(Y)±ρD(X)
D(Y)
(5)
D
(
X
)
=
E
(
X
−
C
)
2
,
C
≠
E
(
X
)
D(X)=E{(X-C)}^2,C\neq E(X)
D(X)=E(X−C)2,C=E(X)
(6)
D
(
X
)
=
0
⇔
P
{
X
=
C
}
=
1
D(X)=0\Leftrightarrow P\left\{X=C\right\}=1
D(X)=0⇔P{X=C}=1
(1)对于函数
Y
=
g
(
x
)
Y=g(x)
Y=g(x)
X
X
X为离散型:
P
{
X
=
x
i
}
=
p
i
,
E
(
Y
)
=
∑
i
g
(
x
i
)
p
i
P\left\{X=x_i\right\}=p_i,E(Y)={\textstyle\sum_i}g(x_i)p_i
P{X=xi}=pi,E(Y)=∑ig(xi)pi
X
X
X为连续型:
X
∼
f
(
x
)
,
E
(
Y
)
=
∫
−
∞
+
∞
g
(
x
)
f
(
x
)
d
x
X\sim f(x),E(Y)=\int_{-\infty}^{+\infty}g(x)f(x)\operatorname dx
X∼f(x),E(Y)=∫−∞+∞g(x)f(x)dx
(2)
Z
=
g
(
X
,
Y
)
;
(
X
,
Y
)
∼
P
{
X
=
x
i
,
Y
=
y
i
}
=
p
i
j
;
E
(
Z
)
=
∑
i
∑
j
g
(
x
i
,
y
j
)
p
i
j
(
X
,
Y
)
∼
f
(
x
,
y
)
;
E
(
Z
)
=
∫
−
∞
+
∞
∫
−
∞
+
∞
g
(
x
,
y
)
f
(
x
,
y
)
d
x
d
y
Z=g\left(X,Y\right);\left(X,Y\right)\sim P\left\{X=x_i,Y=y_i\right\}=p_{ij};E(Z)={\textstyle\sum_i}{\textstyle\sum_j}g(x_i,y_j)p_{ij}\\(X,Y)\sim f(x,y);E(Z)=\int_{-\infty}^{+\infty}\int_{-\infty}^{+\infty}g(x,y)f(x,y)\operatorname dxdy
Z=g(X,Y);(X,Y)∼P{X=xi,Y=yi}=pij;E(Z)=∑i∑jg(xi,yj)pij(X,Y)∼f(x,y);E(Z)=∫−∞+∞∫−∞+∞g(x,y)f(x,y)dxdy
C o v ( X , Y ) = E [ ( X − E ( X ) ) ( Y − E ( Y ) ] Cov(X,Y)=E\left[(X-E(X))(Y-E(Y)\right] Cov(X,Y)=E[(X−E(X))(Y−E(Y)]
ρ
X
Y
=
C
o
v
(
X
,
Y
)
D
(
X
)
D
(
Y
)
\rho_{XY}=\frac{Cov(X,Y)}{\sqrt{D(X)}\sqrt{D(Y)}}
ρXY=D(X)
D(Y)
Cov(X,Y),
k
k
k阶原点矩
E
(
X
k
)
E(X^k)
E(Xk);
k
k
k阶中心距
E
{
[
X
−
E
(
X
)
]
k
}
E\left\{\left[X-E(X)\right]^k\right\}
E{[X−E(X)]k}
性质:
(1)
C
o
v
(
X
,
Y
)
=
C
o
v
(
Y
,
X
)
Cov(X,Y)=Cov(Y,X)
Cov(X,Y)=Cov(Y,X)
(2)
C
o
v
(
a
X
,
b
Y
)
=
a
b
C
o
v
(
Y
,
X
)
Cov(aX,bY)=abCov(Y,X)
Cov(aX,bY)=abCov(Y,X)
(3)
C
o
v
(
X
1
+
X
2
,
Y
)
=
C
o
v
(
X
1
,
Y
)
+
C
o
v
(
X
2
,
Y
)
Cov(X_1+X_2,Y)=Cov(X_1,Y)+Cov(X_2,Y)
Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y)
(4)
∣
ρ
(
X
,
Y
)
∣
≤
1
\left|\rho(X,Y)\right|\leq1
∣ρ(X,Y)∣≤1
(5)
ρ
(
X
,
Y
)
=
1
⇔
P
(
Y
=
a
X
+
b
)
=
1
,
其
中
a
>
0
ρ
(
X
,
Y
)
=
−
1
⇔
P
(
Y
=
a
X
+
b
)
=
1
,
其
中
a
<
0
\rho(X,Y)=1\Leftrightarrow P(Y=aX+b)=1,\mathrm{其中}a>0\\\rho(X,Y)=-1\Leftrightarrow P(Y=aX+b)=1,\mathrm{其中}a<0
ρ(X,Y)=1⇔P(Y=aX+b)=1,其中a>0ρ(X,Y)=−1⇔P(Y=aX+b)=1,其中a<0
( 1 ) D ( X ) = E ( X 2 ) − E 2 ( X ) ( 2 ) C o v ( X , Y ) = E ( X , Y ) − E ( X ) E ( Y ) ( 3 ) ρ ( X , Y ) = 0 ⇔ C o v ( X , Y ) = 0 ⇔ E ( X , Y ) = E ( X ) E ( Y ) ⇔ D ( X ± Y ) = D ( X ) + D ( Y ) (1)D(X)=E(X^2)-E^2(X)\\(2)Cov(X,Y)=E(X,Y)-E(X)E(Y)\\(3)\rho(X,Y)=0\Leftrightarrow Cov(X,Y)=0\Leftrightarrow E(X,Y)=E(X)E(Y)\Leftrightarrow D(X\pm Y)=D(X)+D(Y) (1)D(X)=E(X2)−E2(X)(2)Cov(X,Y)=E(X,Y)−E(X)E(Y)(3)ρ(X,Y)=0⇔Cov(X,Y)=0⇔E(X,Y)=E(X)E(Y)⇔D(X±Y)=D(X)+D(Y)
总体:研究对象的全体,它是一个随机变量,用
X
X
X表示。
个体:组成总体的每个基本元素。
简单随机样本:来自总体
X
X
X的
n
n
n个相互独立且与总体同分布的随机变量
X
1
,
X
2
,
⋯
X
n
X_1,X_2,\cdots X_n
X1,X2,⋯Xn,称为容量为
n
n
n的简单随机样本,简称样本。
统计量:设
X
1
,
X
2
,
⋯
X
n
X_1,X_2,\cdots X_n
X1,X2,⋯Xn是来自总体
X
X
X的一个样本,
g
(
X
1
,
X
2
,
⋯
X
n
)
g(X_1,X_2,\cdots X_n)
g(X1,X2,⋯Xn)是样本的连续函数,且
g
(
⋅
)
g(\cdot)
g(⋅)中不含任何未知参数,则称
g
(
X
1
,
X
2
,
⋯
X
n
)
g(X_1,X_2,\cdots X_n)
g(X1,X2,⋯Xn)为统计量
样本均值:
X
‾
=
1
n
∑
i
=
1
n
X
i
\overline X=\frac1n{\textstyle\sum_{i=1}^n}X_i
X=n1∑i=1nXi
样本方差:
S
2
=
1
n
−
1
∑
i
=
1
n
(
X
i
−
X
‾
)
2
S^2=\frac1{n-1}{\textstyle\sum_{i=1}^n}{(X_i-\overline X)}^2
S2=n−11∑i=1n(Xi−X)2
样本矩:样本
k
k
k阶原点矩:
A
k
=
1
n
∑
i
=
1
n
X
i
k
,
k
=
1
,
2
,
⋯
A_k=\frac1n{\textstyle\sum_{i=1}^n}X_i^k,k=1,2,\cdots
Ak=n1∑i=1nXik,k=1,2,⋯
样本
k
k
k阶中心矩:
B
k
=
1
n
∑
i
=
1
n
(
X
i
−
X
‾
)
k
,
k
=
1
,
2
,
⋯
B_k=\frac1n{\textstyle\sum_{i=1}^n}{(X_i-\overline X)}^k,k=1,2,\cdots
Bk=n1∑i=1n(Xi−X)k,k=1,2,⋯
X
2
\mathcal X^2
X2分布
X
2
=
X
1
2
+
X
2
2
+
⋯
+
X
n
2
∼
X
2
(
n
)
\mathcal X^2=X_1^2+X_2^2+\cdots+X_n^2\sim\mathcal X^2(n)
X2=X12+X22+⋯+Xn2∼X2(n),其中
X
1
,
X
2
,
⋯
X
n
X_1,X_2,\cdots X_n
X1,X2,⋯Xn相互独立,且同服从
N
(
0
,
1
)
N(0,1)
N(0,1)
t
t
t分布:
T
=
X
Y
/
n
∼
t
(
n
)
T=\frac X{\sqrt{Y/n}}\sim t(n)
T=Y/n
X∼t(n),其中
X
∼
N
(
0
,
1
)
,
Y
∼
X
2
(
n
)
X\sim N(0,1),Y\sim\mathcal X^2(n)
X∼N(0,1),Y∼X2(n),且
X
,
Y
X,Y
X,Y相互独立
F
F
F分布:
F
=
X
/
n
1
Y
/
n
2
∼
F
(
n
1
,
n
2
)
F=\frac{X/n_1}{Y/n_2}\sim F(n_1,n_2)
F=Y/n2X/n1∼F(n1,n2),其中
X
∼
X
2
(
n
1
)
,
Y
∼
X
2
(
n
2
)
X\sim\mathcal X^2(n_1),Y\sim\mathcal X^2(n_2)
X∼X2(n1),Y∼X2(n2),且
X
,
Y
X,Y
X,Y相互独立
分位数:若
P
(
X
≤
x
α
)
=
α
P(X\leq x_\alpha)=\alpha
P(X≤xα)=α,则称
x
α
x_\alpha
xα为
X
X
X的
α
\alpha
α分位数
(1)设
X
1
,
X
2
,
⋯
X
n
X_1,X_2,\cdots X_n
X1,X2,⋯Xn为来自正态总体
N
(
μ
,
σ
2
)
N(\mu,\sigma^2)
N(μ,σ2)的样本,
X
‾
=
1
n
∑
i
=
1
n
X
i
\overline X=\frac1n{\textstyle\sum_{i=1}^n}X_i
X=n1∑i=1nXi,
S
2
=
1
n
−
1
∑
i
=
1
n
(
X
i
−
X
‾
)
2
S^2=\frac1{n-1}{\textstyle\sum_{i=1}^n}{(X_i-\overline X)}^2
S2=n−11∑i=1n(Xi−X)2,则:
1)
X
‾
∼
N
(
μ
,
σ
2
n
)
或
者
X
‾
−
μ
σ
n
∼
N
(
0
,
1
)
\overline X\sim N(\mu,\frac{\sigma^2}n)\mathrm{或者}\frac{\overline X-\mu}{\frac\sigma{\sqrt n}}\sim N(0,1)
X∼N(μ,nσ2)或者n
σX−μ∼N(0,1)
2)
(
n
−
1
)
S
2
σ
2
=
1
σ
2
∑
i
=
1
n
(
X
i
−
X
‾
)
2
∼
X
2
(
n
−
1
)
\frac{(n-1)S^2}{\sigma^2}=\frac1{\sigma^2}{\textstyle\sum_{i=1}^n}{(X_i-\overline X)}^2\sim\mathcal X^2(n-1)
σ2(n−1)S2=σ21∑i=1n(Xi−X)2∼X2(n−1)
3)
1
σ
2
∑
i
=
1
n
(
X
i
−
μ
)
2
∼
X
2
(
n
)
\frac1{\sigma^2}{\textstyle\sum_{i=1}^n}{(X_i-\mu)}^2\sim\mathcal X^2(n)
σ21∑i=1n(Xi−μ)2∼X2(n)
4)
X
‾
−
μ
S
n
∼
t
(
n
−
1
)
\frac{\overline X-\mu}{\displaystyle\frac S{\sqrt n}}\sim t(n-1)
n
SX−μ∼t(n−1)
(1)对于
X
2
∼
X
2
(
n
)
\mathcal X^2\sim\mathcal X^2(n)
X2∼X2(n),有
E
(
X
2
(
n
)
)
=
n
,
D
(
X
2
(
n
)
)
=
2
n
E(\mathcal X^2(n))=n,D(\mathcal X^2(n))=2n
E(X2(n))=n,D(X2(n))=2n
(2)对于
T
∼
t
(
n
)
T\sim t(n)
T∼t(n),有
E
(
T
)
=
0
,
D
(
T
)
=
n
n
−
2
(
n
>
2
)
E(T)=0,D(T)=\frac n{n-2}(n>2)
E(T)=0,D(T)=n−2n(n>2)
(3)对于
F
∼
F
(
m
,
n
)
F\sim F(m,n)
F∼F(m,n),有
1
F
∼
F
(
m
,
n
)
,
F
α
/
2
(
m
,
n
)
=
1
F
1
−
α
/
2
(
n
,
m
)
\frac1F\sim F(m,n),F_{\alpha/2}(m,n)=\frac1{F_{1-_{\alpha/2}}(n,m)}
F1∼F(m,n),Fα/2(m,n)=F1−α/2(n,m)1
(4)对于任意总体
X
X
X,有
E
(
X
‾
)
=
E
(
X
)
,
E
(
S
2
)
=
D
(
X
)
,
D
(
X
‾
)
=
D
(
X
)
n
E(\overline X)=E(X),E(S^2)=D(X),D(\overline X)=\frac{D(X)}n
E(X)=E(X),E(S2)=D(X),D(X)=nD(X)
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。