当前位置:   article > 正文

【泊松分布】

泊松分布


前言

泊松分布作为一个离散变量的概率分布,在初学概率论时算一个难以理解的内容。


一、泊松分布的意义

\qquad 讲到泊松分布,就是对于某事件的离散变量:X ∈ \in N
P { X = k } = λ k e − λ k ! P\{X=k\} = \frac{λ^ke^{-λ}}{k!} P{X=k}=k!λkeλ
\qquad 已知 e x e^x ex的麦克劳林公式,在 x ∈ R x\in\R xR上恒成立:
e x = ∑ k = 0 ∞ x k k ! e^x=\sum_{k=0}^{\infty} \frac{x^k}{k!} ex=k=0k!xk
\qquad 所以,当 X X X ( 0 , + ∞ ) (0,+\infty) (0,+)上取值并求和,这个值为1,即
∑ k = 0 ∞ λ k e − λ k ! = e − λ ∑ k = 0 ∞ λ k k ! = e − λ e λ = 1 \sum_{k=0}^{\infty} \frac{λ^ke^{-λ}}{k!} = e^{-λ}\sum_{k=0}^{\infty} \frac{λ^k}{k!} = e^{-λ}e^{λ} = 1 k=0k!λkeλ=eλk=0k!λk=eλeλ=1
\qquad 从这里我们可以很直观地想到,当某个试验 E E E的概率分布满足泊松分布时,即存在囊括了试验 E E E所有结果的样本空间 S = { s 1 , s 2 , … , s n } S=\{s_1, s_2, \dots , s_n \} S={s1,s2,,sn}——
\qquad 而在各个样本点的发生概率,就是 P { X = s i } P\{X=s_i\} P{X=si}
\qquad 只不过,试验 E E E的样本空间 S S S的长度为 ∞ \infty 。也就是说,泊松分布是对试验发生概率,无限的离散估计
\qquad 这么想,泊松分布就颇有高数里累加和积分那种关系的味道了,感兴趣的同学不妨可以自己去深究一下这种关系的内在韵味。


二、泊松分布与二项分布的联系

1.二项分布的具体条件

形象一点地讲,就是:
\quad 假设有一批产品,其中存在次品,当次品出现的概率满足:
\qquad 独立:各产品间不会互相影响次品出现的概率;
\qquad 等概率:每个产品的制作工艺都相同,使每个产品成为次品的概率相同;
\qquad 二项:确保每产品只有两种状态,要么次品(0),要么成品(1),绝对不能出现第三种情况,则称这种产品的次品出现率满足二项分布
\qquad
再放个二项分布的表达式给大家自行体会: p \quad p p是试验单次成功率,n是试验次数
( 1 − p + p ) n = ∏ i = 1 n ( 1 − p + p ) = ∑ i = 0 n C n i ( 1 − p ) i p n − i = 1 (1-p+p)^{n} =\prod_{i=1}^{n} (1-p+p) =\sum_{i=0}^{n} C_{n}^{i}(1-p)^ip^{n-i}=1 (1p+p)n=i=1n(1p+p)=i=0nCni(1p)ipni=1

2.二项 → \to 泊松:离散化?无穷化?

对n次实验的二项分布中,有k次实验成功的概率为:
P { X = k } = C n k p k ( 1 − p ) n − k = n ( n − 1 ) ⋯ ( n − k + 1 ) k ! p k ( 1 − p ) n − k P\{X=k\}=C_{n}^{k}p^{k}(1-p)^{n-k} =\frac{n(n-1)\cdots(n-k+1)}{k!}p^{k}(1-p)^{n-k} P{X=k}=Cnkpk(1p)nk=k!n(n1)(nk+1)pk(1p)nk
由于 n p = λ np=\lambda np=λ,代入得:
原式 = λ k k ! ∗ 1 ( 1 − 1 n ) ⋯ ( 1 − k − 1 n ) ∗ ( 1 − λ n ) n ∗ ( 1 − λ n ) − k 原式=\frac{\lambda^k}{k!}*1(1-\frac{1}{n})\cdots(1-\frac{k-1}{n})*(1-\frac{\lambda}{n})^n*(1-\frac{\lambda}{n})^{-k} 原式=k!λk1(1n1)(1nk1)(1nλ)n(1nλ)k
此时,我们令 n n n趋向于正无穷,而 k , λ k,\lambda k,λ独立于 n n n为远小于 n n n的已知量,则
lim ⁡ n → ∞ P { X = k } = λ k k ! ∗ lim ⁡ n → ∞ ∏ i = 0 k − 1 1 − i n ∗ lim ⁡ n → ∞ ( 1 − λ n ) n ∗ lim ⁡ n → ∞ ( 1 − λ n ) − k \lim_{n \to \infty}P\{X=k\}\\ =\frac{\lambda^k}{k!}* \lim_{n \to \infty}\prod_{i=0}^{k-1} 1-\frac{i}{n}* \lim_{n \to \infty}(1-\frac{\lambda}{n})^n* \lim_{n \to \infty}(1-\frac{\lambda}{n})^{-k} nlimP{X=k}=k!λknlimi=0k11ninlim(1nλ)nnlim(1nλ)k
\qquad 又由重要极限 lim ⁡ n → ∞ ( 1 + 1 n ) n = e \lim_{n \to \infty}(1+\frac{1}{n})^n=e nlim(1+n1)n=e
\qquad 可知,
lim ⁡ n → ∞ ( 1 − λ n ) n = e − λ lim ⁡ n → ∞ ( 1 − λ n ) − k = 1 \lim_{n \to \infty}(1-\frac{\lambda}{n})^n =e^{-\lambda}\quad \lim_{n \to \infty}(1-\frac{\lambda}{n})^{-k}=1 nlim(1nλ)n=eλnlim(1nλ)k=1
\qquad 而对于
lim ⁡ n → ∞ ∏ i = 0 k − 1 1 − i n = lim ⁡ n → ∞ ∏ i = 0 k − 1 e ln ⁡ ( 1 − i n ) = e lim ⁡ n → ∞ ∑ i = 0 k − 1 ln ⁡ ( 1 − i n ) \lim_{n \to \infty}\prod_{i=0}^{k-1} 1-\frac{i}{n}\\ =\lim_{n \to \infty}\prod_{i=0}^{k-1}e^{\ln(1-\frac{i}{n})}\\ =e^{\lim_{n \to \infty}\sum_{i=0}^{k-1}{\ln(1-\frac{i}{n})}} nlimi=0k11ni=nlimi=0k1eln(1ni)=elimni=0k1ln(1ni)

lim ⁡ n → ∞ ∑ i = 0 k − 1 ln ⁡ ( 1 − i n ) = n lim ⁡ n → ∞ ∑ i = 0 k − 1 ln ⁡ ( 1 − i n ) 1 n = n ∫ 0 k − 1 n ln ⁡ ( 1 − x )   d x = n ∫ 1 − k − 1 n 1 ln ⁡ t   d t = t ln ⁡ t − t ∣ 1 − k − 1 n 1 ∗ n = lim ⁡ n → ∞ − ( k − 1 ) + n − k + 1 n ( k − 1 ) = 0 \lim_{n \to \infty}\sum_{i=0}^{k-1}{\ln(1-\frac{i}{n})}\\ =n\lim_{n \to \infty}\sum_{i=0}^{k-1}{\ln(1-\frac{i}{n})}\frac{1}{n}\\ =n\int_0^{\frac{k-1}{n}} {\ln(1-x)} \,{\rm d}x\\ =n\int_{1-\frac{k-1}{n}}^1 {\ln{t}} \,{\rm d}t\\ =t\ln{t}-t|_{1-\frac{k-1}{n}}^{1}*n\\ =\lim_{n \to \infty}-(k-1)+\frac{n-k+1}{n}(k-1)=0 nlimi=0k1ln(1ni)=nnlimi=0k1ln(1ni)n1=n0nk1ln(1x)dx=n1nk11lntdt=tlntt1nk11n=nlim(k1)+nnk+1(k1)=0
即,
lim ⁡ n → ∞ ∏ i = 0 k − 1 1 − i n = 1 \lim_{n \to \infty}\prod_{i=0}^{k-1} 1-\frac{i}{n}=1 nlimi=0k11ni=1
所以,得:
lim ⁡ n → ∞ P { X = k } = λ k k ! e − λ \lim_{n \to \infty}P\{X=k\}=\frac{\lambda^k}{k!}e^{-\lambda} nlimP{X=k}=k!λkeλ


下面给大家举个我自己作业里的简单例子:
在这里插入图片描述
在这里插入图片描述
正常思路:
(i)在8分钟内,来电次数的期望为2,且来电次数的分布概率满足泊松分布,
P { X = k } = 2 k e − 2 k ! P\{X=k\}= \frac{2^ke^{-2}}{k!} P{X=k}=k!2ke2
所以不来电的概率为:
P { X = 0 } = e − 2 P\{X=0\}= e^{-2} P{X=0}=e2
(ii)这里可以看做两个并列的泊松分布,一个是2分钟内来电的泊松分布,一个是4分钟内来电的泊松分布:
P 1 { X = k } = 0. 5 k e − 0.5 k ! P 2 { X = k } = 1 k e − 1 k ! = e − 1 k ! P_1\{X=k\}= \frac{0.5^ke^{-0.5}}{k!} \qquad P_2\{X=k\}= \frac{1^ke^{-1}}{k!}=\frac{e^{-1}}{k!} P1{X=k}=k!0.5ke0.5P2{X=k}=k!1ke1=k!e1
想要让下一个来电落在2-6分钟,只要让2-6分钟内的来电不为0就行,
P = 1 { X = 0 } ( 1 − P 2 { X = 0 } ) = e − 0.5 ( 1 − e − 1 ) P=_1\{X=0\}(1-P_2\{X=0\})=e^{-0.5}(1-e^{-1}) P=1{X=0}(1P2{X=0})=e0.5(1e1)
(iii)很简单,泊松分布的简单应用,
令时间长度为 t t t分钟, λ = t 4 \lambda=\frac{t}{4} λ=4t
P { X ≥ 1 } = 1 − P { X = 0 } 1 − e − t 4 = 0.7 P\{X\ge1\}=1-P\{X=0\} \qquad 1-e^{-\frac{t}{4}}=0.7 P{X1}=1P{X=0}1e4t=0.7
(iv)可得泊松分布 P { X = k } = 3 k e − 3 k ! P\{X=k\}= \frac{3^ke^{-3}}{k!} P{X=k}=k!3ke3
P { X ≥ 3 } = 1 − P { X = 0 } − P { X = 1 } − P { X = 2 } = 1 − e − 3 − 3 e − 3 − 9 e − 3 2 = 1 − 8.5 e − 3 P\{X\ge3\}=1-P\{X=0\} -P\{X=1\} -P\{X=2\} =1-e^{-3}-3e^{-3}-\frac{9e^{-3}}{2} =1-8.5e^{-3} P{X3}=1P{X=0}P{X=1}P{X=2}=1e33e329e3=18.5e3
\quad
二项求解思路:设题给条件4分钟内试验了n次,则二项分布期望 n p = 1 np=1 np=1,所以 p = 1 n p=\frac{1}{n} p=n1
(i)8分钟的试验次数为 2 n 2n 2n次,则
P = lim ⁡ n → + ∞ C 2 n 0 ( 1 − 1 n ) 2 n = lim ⁡ n → + ∞ ( 1 − 1 n ) 2 n = e − 2 P=\lim_{n \to +\infty}C_{2n}^{0}(1-\frac{1}{n})^{2n} =\lim_{n \to +\infty}(1-\frac{1}{n})^{2n}=e^{-2} P=n+limC2n0(1n1)2n=n+lim(1n1)2n=e2
(ii)这里的来电区间是 ( 0 , t ) (0, t) (0,t) t ∈ ( 2 , 6 ) t \in (2,6) t(2,6),即需要将来电概率在 ( 0 , t ) (0,t) (0,t)区间的t点上累加,
P = lim ⁡ n → ∞ ∑ i = 0 n − 1 1 n ( 1 − 1 n ) n 2 + i = lim ⁡ n → ∞ ∑ i = 0 n − 1 1 n ( 1 − 1 n ) n 2 1 n ( 1 − 1 n ) i = lim ⁡ n → ∞ 1 n ( 1 − 1 n ) n 2 ∑ i = 0 n − 1 ( 1 − 1 n ) i = lim ⁡ n → ∞ ( 1 − 1 n ) n 2 × lim ⁡ n → ∞ 1 n ∑ i = 0 n − 1 ( 1 − 1 n ) i = e − 1 2 lim ⁡ n → ∞ 1 n ∑ i = 0 n − 1 ( 1 − 1 n ) n i n = e − 1 2 lim ⁡ n → ∞ 1 n ∑ i = 0 n − 1 e − i n = e − 1 2 ∫ 0 1 e − x   d x = e − 1 2 ( 1 − e − 1 ) P=\lim_{n \to \infty}\sum_{i=0}^{n-1} \frac{1}{n}(1-\frac{1}{n})^{\frac{n}{2}+i}\\ =\lim_{n \to \infty}\sum_{i=0}^{n-1} \frac{1}{n}(1-\frac{1}{n})^{\frac{n}{2}}\frac{1}{n}(1-\frac{1}{n})^{i}\\ =\lim_{n \to \infty} \frac{1}{n}(1-\frac{1}{n})^{\frac{n}{2}} \sum_{i=0}^{n-1} (1-\frac{1}{n})^{i}\\ =\lim_{n \to \infty} (1-\frac{1}{n})^{\frac{n}{2}} \times \lim_{n \to \infty} \frac{1}{n}\sum_{i=0}^{n-1} (1-\frac{1}{n})^{i}\\ =e^{-\frac{1}{2}}\lim_{n \to \infty} \frac{1}{n}\sum_{i=0}^{n-1} (1-\frac{1}{n})^{n\frac{i}{n}}\\ =e^{-\frac{1}{2}}\lim_{n \to \infty} \frac{1}{n}\sum_{i=0}^{n-1} e^{-\frac{i}{n}}\\ =e^{-\frac{1}{2}} \int_0^1 {e^{-x}} \,{\rm d}x\\ =e^{-\frac{1}{2}}(1-e^{-1}) P=nlimi=0n1n1(1n1)2n+i=nlimi=0n1n1(1n1)2nn1(1n1)i=nlimn1(1n1)2ni=0n1(1n1)i=nlim(1n1)2n×nlimn1i=0n1(1n1)i=e21nlimn1i=0n1(1n1)nni=e21nlimn1i=0n1eni=e2101exdx=e21(1e1)
(iii)同上思路,
令时间长度为 t t t分钟,试验次数为 t 4 n \frac{t}{4}n 4tn
1 − lim ⁡ n → + ∞ ( 1 − 1 n ) t 4 n = 0.7 1 − e − t 4 = 0.7 1-\lim_{n \to +\infty}(1-\frac{1}{n})^{\frac{t}{4}n}=0.7\\ 1-e^{-\frac{t}{4}}=0.7 1n+lim(1n1)4tn=0.71e4t=0.7
(iv)自行求解


总结

在二项变泊松的推导过程中,我们是有一个重要的假设的,那就是二项分布的实验次数为 ∞ \infty 。也正是因为这个原因:
\qquad 如果想把二项分布看做泊松分布时,条件就会非常苛刻,单次概率 p p p必须得小(推导过程过程中 p = k ∞ p=\frac{k}{\infty} p=k是趋向于0的),而试验次数 n n n又不能太小(在推导过程中 n = + ∞ n=+\infty n=+),最后 n p np np还得像个正常的常数(即推导过程中假设的泊松分布期望 λ \lambda λ);
\qquad 但泊松分布看做二项分布却不会有这样的问题,只需对泊松分布的期望单位,假设一个趋向于 + ∞ +\infty + n n n作为二项的实验次数即可,并注意二项分布的单次概率与泊松分布的期望之间的转换,最后以求极限的方式来计算。
\qquad 最后想说,泊松能作为独立的概率分布存在,肯定有它的优越性。将泊松的题用二项来解只是单纯为了加深初学者对泊松分布的理解,最终的目的依然是要熟练掌握泊松分布的原理和解题思路。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/爱喝兽奶帝天荒/article/detail/962162
推荐阅读
相关标签
  

闽ICP备14008679号