赞
踩
泊松分布作为一个离散变量的概率分布,在初学概率论时算一个难以理解的内容。
\qquad
讲到泊松分布,就是对于某事件的离散变量:X
∈
\in
∈N:
P
{
X
=
k
}
=
λ
k
e
−
λ
k
!
P\{X=k\} = \frac{λ^ke^{-λ}}{k!}
P{X=k}=k!λke−λ
\qquad
已知
e
x
e^x
ex的麦克劳林公式,在
x
∈
R
x\in\R
x∈R上恒成立:
e
x
=
∑
k
=
0
∞
x
k
k
!
e^x=\sum_{k=0}^{\infty} \frac{x^k}{k!}
ex=k=0∑∞k!xk
\qquad
所以,当
X
X
X在
(
0
,
+
∞
)
(0,+\infty)
(0,+∞)上取值并求和,这个值为1,即
∑
k
=
0
∞
λ
k
e
−
λ
k
!
=
e
−
λ
∑
k
=
0
∞
λ
k
k
!
=
e
−
λ
e
λ
=
1
\sum_{k=0}^{\infty} \frac{λ^ke^{-λ}}{k!} = e^{-λ}\sum_{k=0}^{\infty} \frac{λ^k}{k!} = e^{-λ}e^{λ} = 1
k=0∑∞k!λke−λ=e−λk=0∑∞k!λk=e−λeλ=1
\qquad
从这里我们可以很直观地想到,当某个试验
E
E
E的概率分布满足泊松分布时,即存在囊括了试验
E
E
E所有结果的样本空间
S
=
{
s
1
,
s
2
,
…
,
s
n
}
S=\{s_1, s_2, \dots , s_n \}
S={s1,s2,…,sn}——
\qquad
而在各个样本点的发生概率,就是
P
{
X
=
s
i
}
P\{X=s_i\}
P{X=si}。
\qquad
只不过,试验
E
E
E的样本空间
S
S
S的长度为
∞
\infty
∞。也就是说,泊松分布是对试验发生概率,无限的离散估计。
\qquad
这么想,泊松分布就颇有高数里累加和积分那种关系的味道了,感兴趣的同学不妨可以自己去深究一下这种关系的内在韵味。
形象一点地讲,就是:
\quad
假设有一批产品,其中存在次品,当次品出现的概率满足:
\qquad
①独立:各产品间不会互相影响次品出现的概率;
\qquad
②等概率:每个产品的制作工艺都相同,使每个产品成为次品的概率相同;
\qquad
③二项:确保每产品只有两种状态,要么次品(0),要么成品(1),绝对不能出现第三种情况,则称这种产品的次品出现率满足二项分布。
\qquad
再放个二项分布的表达式给大家自行体会:
p
\quad p
p是试验单次成功率,n是试验次数
(
1
−
p
+
p
)
n
=
∏
i
=
1
n
(
1
−
p
+
p
)
=
∑
i
=
0
n
C
n
i
(
1
−
p
)
i
p
n
−
i
=
1
(1-p+p)^{n} =\prod_{i=1}^{n} (1-p+p) =\sum_{i=0}^{n} C_{n}^{i}(1-p)^ip^{n-i}=1
(1−p+p)n=i=1∏n(1−p+p)=i=0∑nCni(1−p)ipn−i=1
对n次实验的二项分布中,有k次实验成功的概率为:
P
{
X
=
k
}
=
C
n
k
p
k
(
1
−
p
)
n
−
k
=
n
(
n
−
1
)
⋯
(
n
−
k
+
1
)
k
!
p
k
(
1
−
p
)
n
−
k
P\{X=k\}=C_{n}^{k}p^{k}(1-p)^{n-k} =\frac{n(n-1)\cdots(n-k+1)}{k!}p^{k}(1-p)^{n-k}
P{X=k}=Cnkpk(1−p)n−k=k!n(n−1)⋯(n−k+1)pk(1−p)n−k
由于
n
p
=
λ
np=\lambda
np=λ,代入得:
原式
=
λ
k
k
!
∗
1
(
1
−
1
n
)
⋯
(
1
−
k
−
1
n
)
∗
(
1
−
λ
n
)
n
∗
(
1
−
λ
n
)
−
k
原式=\frac{\lambda^k}{k!}*1(1-\frac{1}{n})\cdots(1-\frac{k-1}{n})*(1-\frac{\lambda}{n})^n*(1-\frac{\lambda}{n})^{-k}
原式=k!λk∗1(1−n1)⋯(1−nk−1)∗(1−nλ)n∗(1−nλ)−k
此时,我们令
n
n
n趋向于正无穷,而
k
,
λ
k,\lambda
k,λ独立于
n
n
n为远小于
n
n
n的已知量,则
lim
n
→
∞
P
{
X
=
k
}
=
λ
k
k
!
∗
lim
n
→
∞
∏
i
=
0
k
−
1
1
−
i
n
∗
lim
n
→
∞
(
1
−
λ
n
)
n
∗
lim
n
→
∞
(
1
−
λ
n
)
−
k
\lim_{n \to \infty}P\{X=k\}\\ =\frac{\lambda^k}{k!}* \lim_{n \to \infty}\prod_{i=0}^{k-1} 1-\frac{i}{n}* \lim_{n \to \infty}(1-\frac{\lambda}{n})^n* \lim_{n \to \infty}(1-\frac{\lambda}{n})^{-k}
n→∞limP{X=k}=k!λk∗n→∞limi=0∏k−11−ni∗n→∞lim(1−nλ)n∗n→∞lim(1−nλ)−k
\qquad
又由重要极限
lim
n
→
∞
(
1
+
1
n
)
n
=
e
\lim_{n \to \infty}(1+\frac{1}{n})^n=e
n→∞lim(1+n1)n=e
\qquad
可知,
lim
n
→
∞
(
1
−
λ
n
)
n
=
e
−
λ
lim
n
→
∞
(
1
−
λ
n
)
−
k
=
1
\lim_{n \to \infty}(1-\frac{\lambda}{n})^n =e^{-\lambda}\quad \lim_{n \to \infty}(1-\frac{\lambda}{n})^{-k}=1
n→∞lim(1−nλ)n=e−λn→∞lim(1−nλ)−k=1
\qquad
而对于
lim
n
→
∞
∏
i
=
0
k
−
1
1
−
i
n
=
lim
n
→
∞
∏
i
=
0
k
−
1
e
ln
(
1
−
i
n
)
=
e
lim
n
→
∞
∑
i
=
0
k
−
1
ln
(
1
−
i
n
)
\lim_{n \to \infty}\prod_{i=0}^{k-1} 1-\frac{i}{n}\\ =\lim_{n \to \infty}\prod_{i=0}^{k-1}e^{\ln(1-\frac{i}{n})}\\ =e^{\lim_{n \to \infty}\sum_{i=0}^{k-1}{\ln(1-\frac{i}{n})}}
n→∞limi=0∏k−11−ni=n→∞limi=0∏k−1eln(1−ni)=elimn→∞∑i=0k−1ln(1−ni)
lim
n
→
∞
∑
i
=
0
k
−
1
ln
(
1
−
i
n
)
=
n
lim
n
→
∞
∑
i
=
0
k
−
1
ln
(
1
−
i
n
)
1
n
=
n
∫
0
k
−
1
n
ln
(
1
−
x
)
d
x
=
n
∫
1
−
k
−
1
n
1
ln
t
d
t
=
t
ln
t
−
t
∣
1
−
k
−
1
n
1
∗
n
=
lim
n
→
∞
−
(
k
−
1
)
+
n
−
k
+
1
n
(
k
−
1
)
=
0
\lim_{n \to \infty}\sum_{i=0}^{k-1}{\ln(1-\frac{i}{n})}\\ =n\lim_{n \to \infty}\sum_{i=0}^{k-1}{\ln(1-\frac{i}{n})}\frac{1}{n}\\ =n\int_0^{\frac{k-1}{n}} {\ln(1-x)} \,{\rm d}x\\ =n\int_{1-\frac{k-1}{n}}^1 {\ln{t}} \,{\rm d}t\\ =t\ln{t}-t|_{1-\frac{k-1}{n}}^{1}*n\\ =\lim_{n \to \infty}-(k-1)+\frac{n-k+1}{n}(k-1)=0
n→∞limi=0∑k−1ln(1−ni)=nn→∞limi=0∑k−1ln(1−ni)n1=n∫0nk−1ln(1−x)dx=n∫1−nk−11lntdt=tlnt−t∣1−nk−11∗n=n→∞lim−(k−1)+nn−k+1(k−1)=0
即,
lim
n
→
∞
∏
i
=
0
k
−
1
1
−
i
n
=
1
\lim_{n \to \infty}\prod_{i=0}^{k-1} 1-\frac{i}{n}=1
n→∞limi=0∏k−11−ni=1
所以,得:
lim
n
→
∞
P
{
X
=
k
}
=
λ
k
k
!
e
−
λ
\lim_{n \to \infty}P\{X=k\}=\frac{\lambda^k}{k!}e^{-\lambda}
n→∞limP{X=k}=k!λke−λ
下面给大家举个我自己作业里的简单例子:
正常思路:
(i)在8分钟内,来电次数的期望为2,且来电次数的分布概率满足泊松分布,
P
{
X
=
k
}
=
2
k
e
−
2
k
!
P\{X=k\}= \frac{2^ke^{-2}}{k!}
P{X=k}=k!2ke−2
所以不来电的概率为:
P
{
X
=
0
}
=
e
−
2
P\{X=0\}= e^{-2}
P{X=0}=e−2
(ii)这里可以看做两个并列的泊松分布,一个是2分钟内来电的泊松分布,一个是4分钟内来电的泊松分布:
P
1
{
X
=
k
}
=
0.
5
k
e
−
0.5
k
!
P
2
{
X
=
k
}
=
1
k
e
−
1
k
!
=
e
−
1
k
!
P_1\{X=k\}= \frac{0.5^ke^{-0.5}}{k!} \qquad P_2\{X=k\}= \frac{1^ke^{-1}}{k!}=\frac{e^{-1}}{k!}
P1{X=k}=k!0.5ke−0.5P2{X=k}=k!1ke−1=k!e−1
想要让下一个来电落在2-6分钟,只要让2-6分钟内的来电不为0就行,
P
=
1
{
X
=
0
}
(
1
−
P
2
{
X
=
0
}
)
=
e
−
0.5
(
1
−
e
−
1
)
P=_1\{X=0\}(1-P_2\{X=0\})=e^{-0.5}(1-e^{-1})
P=1{X=0}(1−P2{X=0})=e−0.5(1−e−1)
(iii)很简单,泊松分布的简单应用,
令时间长度为
t
t
t分钟,
λ
=
t
4
\lambda=\frac{t}{4}
λ=4t
P
{
X
≥
1
}
=
1
−
P
{
X
=
0
}
1
−
e
−
t
4
=
0.7
P\{X\ge1\}=1-P\{X=0\} \qquad 1-e^{-\frac{t}{4}}=0.7
P{X≥1}=1−P{X=0}1−e−4t=0.7
(iv)可得泊松分布
P
{
X
=
k
}
=
3
k
e
−
3
k
!
P\{X=k\}= \frac{3^ke^{-3}}{k!}
P{X=k}=k!3ke−3,
P
{
X
≥
3
}
=
1
−
P
{
X
=
0
}
−
P
{
X
=
1
}
−
P
{
X
=
2
}
=
1
−
e
−
3
−
3
e
−
3
−
9
e
−
3
2
=
1
−
8.5
e
−
3
P\{X\ge3\}=1-P\{X=0\} -P\{X=1\} -P\{X=2\} =1-e^{-3}-3e^{-3}-\frac{9e^{-3}}{2} =1-8.5e^{-3}
P{X≥3}=1−P{X=0}−P{X=1}−P{X=2}=1−e−3−3e−3−29e−3=1−8.5e−3
\quad
二项求解思路:设题给条件4分钟内试验了n次,则二项分布期望
n
p
=
1
np=1
np=1,所以
p
=
1
n
p=\frac{1}{n}
p=n1
(i)8分钟的试验次数为
2
n
2n
2n次,则
P
=
lim
n
→
+
∞
C
2
n
0
(
1
−
1
n
)
2
n
=
lim
n
→
+
∞
(
1
−
1
n
)
2
n
=
e
−
2
P=\lim_{n \to +\infty}C_{2n}^{0}(1-\frac{1}{n})^{2n} =\lim_{n \to +\infty}(1-\frac{1}{n})^{2n}=e^{-2}
P=n→+∞limC2n0(1−n1)2n=n→+∞lim(1−n1)2n=e−2
(ii)这里的来电区间是
(
0
,
t
)
(0, t)
(0,t),
t
∈
(
2
,
6
)
t \in (2,6)
t∈(2,6),即需要将来电概率在
(
0
,
t
)
(0,t)
(0,t)区间的t点上累加,
P
=
lim
n
→
∞
∑
i
=
0
n
−
1
1
n
(
1
−
1
n
)
n
2
+
i
=
lim
n
→
∞
∑
i
=
0
n
−
1
1
n
(
1
−
1
n
)
n
2
1
n
(
1
−
1
n
)
i
=
lim
n
→
∞
1
n
(
1
−
1
n
)
n
2
∑
i
=
0
n
−
1
(
1
−
1
n
)
i
=
lim
n
→
∞
(
1
−
1
n
)
n
2
×
lim
n
→
∞
1
n
∑
i
=
0
n
−
1
(
1
−
1
n
)
i
=
e
−
1
2
lim
n
→
∞
1
n
∑
i
=
0
n
−
1
(
1
−
1
n
)
n
i
n
=
e
−
1
2
lim
n
→
∞
1
n
∑
i
=
0
n
−
1
e
−
i
n
=
e
−
1
2
∫
0
1
e
−
x
d
x
=
e
−
1
2
(
1
−
e
−
1
)
P=\lim_{n \to \infty}\sum_{i=0}^{n-1} \frac{1}{n}(1-\frac{1}{n})^{\frac{n}{2}+i}\\ =\lim_{n \to \infty}\sum_{i=0}^{n-1} \frac{1}{n}(1-\frac{1}{n})^{\frac{n}{2}}\frac{1}{n}(1-\frac{1}{n})^{i}\\ =\lim_{n \to \infty} \frac{1}{n}(1-\frac{1}{n})^{\frac{n}{2}} \sum_{i=0}^{n-1} (1-\frac{1}{n})^{i}\\ =\lim_{n \to \infty} (1-\frac{1}{n})^{\frac{n}{2}} \times \lim_{n \to \infty} \frac{1}{n}\sum_{i=0}^{n-1} (1-\frac{1}{n})^{i}\\ =e^{-\frac{1}{2}}\lim_{n \to \infty} \frac{1}{n}\sum_{i=0}^{n-1} (1-\frac{1}{n})^{n\frac{i}{n}}\\ =e^{-\frac{1}{2}}\lim_{n \to \infty} \frac{1}{n}\sum_{i=0}^{n-1} e^{-\frac{i}{n}}\\ =e^{-\frac{1}{2}} \int_0^1 {e^{-x}} \,{\rm d}x\\ =e^{-\frac{1}{2}}(1-e^{-1})
P=n→∞limi=0∑n−1n1(1−n1)2n+i=n→∞limi=0∑n−1n1(1−n1)2nn1(1−n1)i=n→∞limn1(1−n1)2ni=0∑n−1(1−n1)i=n→∞lim(1−n1)2n×n→∞limn1i=0∑n−1(1−n1)i=e−21n→∞limn1i=0∑n−1(1−n1)nni=e−21n→∞limn1i=0∑n−1e−ni=e−21∫01e−xdx=e−21(1−e−1)
(iii)同上思路,
令时间长度为
t
t
t分钟,试验次数为
t
4
n
\frac{t}{4}n
4tn
1
−
lim
n
→
+
∞
(
1
−
1
n
)
t
4
n
=
0.7
1
−
e
−
t
4
=
0.7
1-\lim_{n \to +\infty}(1-\frac{1}{n})^{\frac{t}{4}n}=0.7\\ 1-e^{-\frac{t}{4}}=0.7
1−n→+∞lim(1−n1)4tn=0.71−e−4t=0.7
(iv)自行求解
在二项变泊松的推导过程中,我们是有一个重要的假设的,那就是二项分布的实验次数为
∞
\infty
∞次。也正是因为这个原因:
\qquad
如果想把二项分布看做泊松分布时,条件就会非常苛刻,单次概率
p
p
p必须得小(推导过程过程中
p
=
k
∞
p=\frac{k}{\infty}
p=∞k是趋向于0的),而试验次数
n
n
n又不能太小(在推导过程中
n
=
+
∞
n=+\infty
n=+∞),最后
n
p
np
np还得像个正常的常数(即推导过程中假设的泊松分布期望
λ
\lambda
λ);
\qquad
但泊松分布看做二项分布却不会有这样的问题,只需对泊松分布的期望单位,假设一个趋向于
+
∞
+\infty
+∞的
n
n
n作为二项的实验次数即可,并注意二项分布的单次概率与泊松分布的期望之间的转换,最后以求极限的方式来计算。
\qquad
最后想说,泊松能作为独立的概率分布存在,肯定有它的优越性。将泊松的题用二项来解只是单纯为了加深初学者对泊松分布的理解,最终的目的依然是要熟练掌握泊松分布的原理和解题思路。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。