赞
踩
——非寿险精算的基本理论
在 n n n次独立重复的伯努利试验中,设每次试验中事件A发生的概率为 p p p。用 X X X表示 n n n重伯努利试验中事件A发生的次数,随机变量 X X X的离散概率分布即为二项分布。
(1)每次试验中事件只有两种结果;
(2)每次试验中事件发生的概率是相同的;
(3) n n n次试验的事件相互之间独立。
P ( X = k ) = C n k p k ( 1 − p ) n − k P(X=k)=C_{n}^kp^k(1-p)^{n-k} P(X=k)=Cnkpk(1−p)n−k
n n n:一组实验中,实验次数为 n n n;
k k k: n n n次实验中,成功的次数为 k k k;
p p p:一次伯努利实验中,成功的概率;
1 − p 1-p 1−p:一次伯努利实验中,失败的概率;
一次伯努利试验只有两个结果,成功或失败。成功的概率为 p p p,则失败的概率就是 1 − p 1-p 1−p
P ( X = k ) P(X=k) P(X=k):一组n次伯努利实验中,成功次数为 k k k的概率;
我们现在做一组5次抛硬币实验,每次实验中正面向上的概率为0.5,则5次实验中,4次正面向上的概率是多少?
1)首先判断是不是伯努利实验
<结合伯努利实验的性质一一对照看一下>
每次试验中事件只有两种结果;是的,要么正面向上,要么反面向上
每次试验中事件发生的概率是相同的;是的,每次正面向上的概率都是0.5
n n n次试验的事件相互之间独立。是相互独立的,第一次实验的结果不会影响到第二次抛硬币实验的结果
2)带入公式求解
P ( X = 4 ) = C 5 4 0. 5 4 ( 1 − 0.5 ) 1 = 0.15625 P(X=4)=C_{5}^40.5^4(1-0.5)^1=0.15625 P(X=4)=C540.54(1−0.5)1=0.15625
补充一个公式: C n m = n ! m ! ( n − m ) ! C_n^m=\frac{n!}{m!(n-m)!} Cnm=m!(n−m)!n!
<公式理解>
5次抛硬币实验中,4次正面向上的事件,一共有5种可能情况,每种情况可参考下图。每种情况发生的概率都为0.03125,五种情况加在一起就是0.03125*5=0.15625。五种情况对应的公式就是 C 5 4 = 5 C_{5}^4=5 C54=5,然后乘以每次实验的概率,就是5次抛硬币实验中,有4次正面向上的概率。
E ( X ) = n p E(X)=np E(X)=np
D ( X ) = n p ( 1 − p ) D(X)=np(1-p) D(X)=np(1−p)
E ( X ) = ∑ x p ( x ) E(X)=\sum xp(x) E(X)=∑xp(x)
这个公式在前面介绍泊松分布的时候提及了一下,但并没有展开说明,有兴趣的可以再去回顾一下概率论知识。
把 P ( X ) = C n x p x ( 1 − p ) n − x P(X)=C_{n}^xp^x(1-p)^{n-x} P(X)=Cnxpx(1−p)n−x带入上式,可得
= ∑ x C n x p x ( 1 − p ) n − x =\sum xC_{n}^xp^x(1-p)^{n-x} =∑xCnxpx(1−p)n−x
因为 C n m = n ! m ! ( n − m ) ! C_n^m=\frac{n!}{m!(n-m)!} Cnm=m!(n−m)!n!,所以 C n x = n ! x ! ( n − x ) ! C_{n}^x=\frac{n!}{x!(n-x)!} Cnx=x!(n−x)!n!,则
= ∑ x n ! x ! ( n − x ) ! p x ( 1 − p ) n − x =\sum x\frac{n!}{x!(n-x)!}p^x(1-p)^{n-x} =∑xx!(n−x)!n!px(1−p)n−x
然后, n ! = n ( n − 1 ) ! n!=n(n-1)! n!=n(n−1)!, p x = p p x − 1 p^x=pp^{x-1} px=ppx−1,带入上式
= ∑ x n ( n − 1 ) ! x ! ( n − x ) ! p p x − 1 ( 1 − p ) n − x =\sum x\frac{n(n-1)!}{x!(n-x)!}pp^{x-1}(1-p)^{n-x} =∑xx!(n−x)!n(n−1)!ppx−1(1−p)n−x
将 n p np np移到 ∑ \sum ∑前面,得到
= n p ∑ x ( n − 1 ) ! x ! ( n − x ) ! p x − 1 ( 1 − p ) n − x =np\sum x\frac{(n-1)!}{x!(n-x)!}p^{x-1}(1-p)^{n-x} =np∑xx!(n−x)!(n−1)!px−1(1−p)n−x
因 x ( n − 1 ) ! x ! ( n − x ) ! = x ( n − 1 ) ! x ( x − 1 ) ! ( n − x ) ! = ( n − 1 ) ! ( x − 1 ) ! ( n − x ) ! = C n − 1 x − 1 x\frac{(n-1)!}{x!(n-x)!}=x\frac{(n-1)!}{x(x-1)!(n-x)!}=\frac{(n-1)!}{(x-1)!(n-x)!}=C_{n-1}^{x-1} xx!(n−x)!(n−1)!=xx(x−1)!(n−x)!(n−1)!=(x−1)!(n−x)!(n−1)!=Cn−1x−1,得到
= n p ∑ C n − 1 x − 1 p x − 1 ( 1 − p ) n − x =np\sum C_{n-1}^{x-1}p^{x-1}(1-p)^{n-x} =np∑Cn−1x−1px−1(1−p)n−x
令 n − 1 = m , x − 1 = k n-1=m,x-1=k n−1=m,x−1=k,得
= n p ∑ C m k p k ( 1 − p ) n − 1 − ( x − 1 ) =np\sum C_{m}^{k}p^{k}(1-p)^{n-1-(x-1)} =np∑Cmkpk(1−p)n−1−(x−1)
= n p ∑ C m k p k ( 1 − p ) m − k =np\sum C_{m}^{k}p^{k}(1-p)^{m-k} =np∑Cmkpk(1−p)m−k
C m k p k ( 1 − p ) m − k C_{m}^{k}p^{k}(1-p)^{m-k} Cmkpk(1−p)m−k,是不是和 P ( X = k ) = C n k p k ( 1 − p ) n − k P(X=k)=C_{n}^kp^k(1-p)^{n-k} P(X=k)=Cnkpk(1−p)n−k形式一模一样,所以 C m k p k ( 1 − p ) m − k = P ( X = k ) C_{m}^{k}p^{k}(1-p)^{m-k}=P(X=k) Cmkpk(1−p)m−k=P(X=k),则
= n p ∑ P ( X = k ) =np\sum P(X=k) =np∑P(X=k)
∑ P ( X = k ) \sum P(X=k) ∑P(X=k)是二项分布所有情况下得概率和,因此其值为1,即 ∑ P ( X = k ) = 1 \sum P(X=k)=1 ∑P(X=k)=1,所以
= n p ∑ P ( X = k ) = n p =np\sum P(X=k)=np =np∑P(X=k)=np
根据之前泊松分布里面的文章,我们知道 D ( X ) = E ( X 2 ) − ( E ( X ) ) 2 D(X)=E(X^2)-(E(X))^2 D(X)=E(X2)−(E(X))2,现在 E ( X ) E(X) E(X)已经求出,因此只需推导 E ( X 2 ) E(X^2) E(X2)即可。
E ( X 2 ) = ∑ x 2 p ( x ) E(X^2)=\sum x^2p(x) E(X2)=∑x2p(x)
这个公式我也曾在泊松分布这篇文章里面提到过,有兴趣的可以去查看。
把 P ( X ) = C n x p x ( 1 − p ) n − x = n ! x ! ( n − x ) ! p x ( 1 − p ) n − x P(X)=C_{n}^xp^x(1-p)^{n-x}=\frac{n!}{x!(n-x)!}p^x(1-p)^{n-x} P(X)=Cnxpx(1−p)n−x=x!(n−x)!n!px(1−p)n−x带入上式
= ∑ x 2 n ! x ! ( n − x ) ! p x ( 1 − p ) n − x =\sum x^2\frac{n!}{x!(n-x)!}p^x(1-p)^{n-x} =∑x2x!(n−x)!n!px(1−p)n−x
把 p x = p p x − 1 , n ! = n ( n − 1 ) ! p^x=pp^{x-1},n!=n(n-1)! px=ppx−1,n!=n(n−1)!带入上式
= ∑ x 2 n ( n − 1 ) ! x ! ( n − x ) ! p p x − 1 ( 1 − p ) n − x =\sum x^2\frac{n(n-1)!}{x!(n-x)!}pp^{x-1}(1-p)^{n-x} =∑x2x!(n−x)!n(n−1)!ppx−1(1−p)n−x
将 n p np np移到 ∑ \sum ∑前面,得到
= n p ∑ x 2 ( n − 1 ) ! x ! ( n − x ) ! p x − 1 ( 1 − p ) n − x =np\sum x^2\frac{(n-1)!}{x!(n-x)!}p^{x-1}(1-p)^{n-x} =np∑x2x!(n−x)!(n−1)!px−1(1−p)n−x
因 x 2 = x x , x ! = x ( x − 1 ) ! x^2=xx,x!=x(x-1)! x2=xx,x!=x(x−1)!所以
= n p ∑ x x ( n − 1 ) ! x ( x − 1 ) ! ( n − x ) ! p x − 1 ( 1 − p ) n − x =np\sum xx\frac{(n-1)!}{x(x-1)!(n-x)!}p^{x-1}(1-p)^{n-x} =np∑xxx(x−1)!(n−x)!(n−1)!px−1(1−p)n−x
因 x x x分子和分母可以约掉,所以
= n p ∑ x ( n − 1 ) ! ( x − 1 ) ! ( n − x ) ! p x − 1 ( 1 − p ) n − x =np\sum x\frac{(n-1)!}{(x-1)!(n-x)!}p^{x-1}(1-p)^{n-x} =np∑x(x−1)!(n−x)!(n−1)!px−1(1−p)n−x
因 x = x − 1 + 1 x=x-1+1 x=x−1+1,所以
= n p ∑ ( x − 1 + 1 ) ( n − 1 ) ! ( x − 1 ) ! ( n − x ) ! p x − 1 ( 1 − p ) n − x =np\sum (x-1+1)\frac{(n-1)!}{(x-1)!(n-x)!}p^{x-1}(1-p)^{n-x} =np∑(x−1+1)(x−1)!(n−x)!(n−1)!px−1(1−p)n−x
= n p ∑ ( x − 1 ) ( n − 1 ) ! ( x − 1 ) ! ( n − x ) ! p x − 1 ( 1 − p ) n − x + n p ∑ ( n − 1 ) ! ( x − 1 ) ! ( n − x ) ! p x − 1 ( 1 − p ) n − x =np\sum (x-1)\frac{(n-1)!}{(x-1)!(n-x)!}p^{x-1}(1-p)^{n-x}+np\sum \frac{(n-1)!}{(x-1)!(n-x)!}p^{x-1}(1-p)^{n-x} =np∑(x−1)(x−1)!(n−x)!(n−1)!px−1(1−p)n−x+np∑(x−1)!(n−x)!(n−1)!px−1(1−p)n−x
这一部分 ∑ ( n − 1 ) ! ( x − 1 ) ! ( n − x ) ! p x − 1 ( 1 − p ) n − x \sum \frac{(n-1)!}{(x-1)!(n-x)!}p^{x-1}(1-p)^{n-x} ∑(x−1)!(n−x)!(n−1)!px−1(1−p)n−x在求解 E X EX EX时,已经推导,其值为1,所以
= n p ∑ ( x − 1 ) ( n − 1 ) ! ( x − 1 ) ! ( n − x ) ! p x − 1 ( 1 − p ) n − x + n p =np\sum (x-1)\frac{(n-1)!}{(x-1)!(n-x)!}p^{x-1}(1-p)^{n-x}+np =np∑(x−1)(x−1)!(n−x)!(n−1)!px−1(1−p)n−x+np
因 ( n − 1 ) ! = ( n − 1 ) ( n − 2 ) ! , ( x − 1 ) ! = ( x − 1 ) ( x − 2 ) ! , p x − 1 = p p x − 2 (n-1)!=(n-1)(n-2)!,(x-1)!=(x-1)(x-2)!,p^{x-1}=pp^{x-2} (n−1)!=(n−1)(n−2)!,(x−1)!=(x−1)(x−2)!,px−1=ppx−2,所以
= n p ∑ ( x − 1 ) ( n − 1 ) ( n − 2 ) ! ( x − 1 ) ( x − 2 ) ! ( n − x ) ! p p x − 2 ( 1 − p ) n − x + n p =np\sum (x-1)\frac{(n-1)(n-2)!}{(x-1)(x-2)!(n-x)!}pp^{x-2}(1-p)^{n-x}+np =np∑(x−1)(x−1)(x−2)!(n−x)!(n−1)(n−2)!ppx−2(1−p)n−x+np
( x − 1 ) (x-1) (x−1)分子分母消掉, ( n − 1 ) p (n-1)p (n−1)p提到 ∑ \sum ∑前面,得
= n p ( n − 1 ) p ∑ ( n − 2 ) ! ( x − 2 ) ! ( n − x ) ! p x − 2 ( 1 − p ) n − x + n p =np(n-1)p\sum \frac{(n-2)!}{(x-2)!(n-x)!}p^{x-2}(1-p)^{n-x}+np =np(n−1)p∑(x−2)!(n−x)!(n−2)!px−2(1−p)n−x+np
令 n − 2 = m , x − 2 = k n-2=m,x-2=k n−2=m,x−2=k,得
= n p ( n − 1 ) p ∑ m ! k ! ( m − k ) ! p k ( 1 − p ) m − k + n p =np(n-1)p\sum \frac{m!}{k!(m-k)!}p^{k}(1-p)^{m-k}+np =np(n−1)p∑k!(m−k)!m!pk(1−p)m−k+np
这一部分 ∑ m ! k ! ( m − k ) ! p k ( 1 − p ) m − k \sum \frac{m!}{k!(m-k)!}p^{k}(1-p)^{m-k} ∑k!(m−k)!m!pk(1−p)m−k,在求解 E X EX EX时,已经知道其值为1,所以
= n p ( n − 1 ) p + n p = n 2 p 2 − n p 2 + n p =np(n-1)p+np=n^2p^2-np^2+np =np(n−1)p+np=n2p2−np2+np
因此:
D ( X ) = E ( X 2 ) − ( E ( X ) ) 2 D(X)=E(X^2)-(E(X))^2 D(X)=E(X2)−(E(X))2
= n 2 p 2 − n p 2 + n p − n 2 p 2 =n^2p^2-np^2+np-n^2p^2 =n2p2−np2+np−n2p2
= n p ( 1 − p ) =np(1-p) =np(1−p)
假设损失次数
N
N
N服从参数为
n
和
p
n和p
n和p的二项分布,则发生
k
k
k次损失的概率为:
P
(
N
=
k
)
=
C
n
k
p
k
(
1
−
p
)
n
−
k
P(N=k)=C_{n}^kp^k(1-p)^{n-k}
P(N=k)=Cnkpk(1−p)n−k
二项分布的均值和方差为:
E ( N ) = n p E(N)=np E(N)=np
D ( N ) = n p ( 1 − p ) D(N)=np(1-p) D(N)=np(1−p)
(1)方差小于均值。这是他与泊松分布和负二项分布在实际运用中的主要区别。泊松分布的方差等于均值,负二项分布的方差大于均值。
(2)假设每个风险发生损失的概率均为 p p p,则二项分布可以描述 n n n个独立同分布的风险所组成的风险集合的损失次数。这句话其实我没有理解通透。
(3)如果用二项分布描述损失次数,则意味着损失次数存在一个最大值,这就是二项分布的参数 n n n。
画图代码
import numpy as np import math import matplotlib.pyplot as plt def bpmf(max_k,n,p): ''' Parameters ---------- max_k : int 二项分布中,实验成功的最大次数. n : int 二项分布的实验次数. p : float 二项分布中,每次实验的成功的概率. Returns ------- k: list 二项分布中,成功次数. probability : lsit 二项分布中,对应成功次数的概率. ''' sample=max_k n=n p=p k_sample=np.arange(sample+1)#会返回一个0至sample的连续整数列表 probability=[] for k in k_sample: temp = (math.factorial(n)/(math.factorial(k)*math.factorial(n-k)))*p**k*(1-p)**(n-k)#计算二项分布的概率 #math.factorial()是阶乘函数 probability.append(temp) return k_sample,probability n=30 max_k=n plt.subplot(1,1,1)#定义图片的布局,针对一张图片来说可以省略该代码 p=0.3 k,probability=bpmf(max_k,n,p)#调用自定义的二项分布函数 plt.plot(k,probability,"r",label="p="+str(p))#画曲线图,并定义曲线为红色"r",并显示图例label(后面是图例名称) plt.plot(k,probability,"ro")#画散点图,并定义散点为红色 plt.title("Binomial distribution(n="+str(n)+")")#设置图片标题 plt.xlabel("Number of successes (k)")#设置图片x轴说明 plt.ylabel("probability")#设置图片y轴说明 plt.legend(loc=0)#将图例放在合适的位置,让系统自动查找
输出结果
从图片可以看出,当实验次数 n n n一定时,随着成功的概率 p p p的变大,函数图像逐渐向右移动(均值变大)。
代码与上面相同,只是保持 p p p不变,而修改了 n n n值和图像表头
输出结果
从图片可以看出,当 p p p保持不变时,随着实验次数的增加,图像逐渐向右移动,并且峰值逐渐变小。
画图代码
def normalpdf(mu,sigma,sample): """ Parameters ---------- mu : float 正态分布的均值. sigma : float 正态分布标准差. sample : int 生成的样本数量,x轴的最大值. Returns ------- x : float x轴值. probability : float 取值为x轴值时,对应的概率密度函数值,相当于离散变量的概率. """ mu = mu sigma = sigma sample = sample x = np.arange(sample+1) probability=np.exp(-(x-mu)**2/(2*sigma**2))/(math.sqrt(2*math.pi)*sigma)#正态分布的概率密度函数 return x,probability n=10 p=0.5 plt.subplot(1,1,1) mean = n*p#二项分布的均值 sigam = math.sqrt(n*p*(1-p))#二项分布的标准差 max_k=n k,probability_bp=bpmf(max_k,n,p) k,probability_no=normalpdf(mean,sigam,max_k) plt.plot(k,probability_no,"r",label="normal") plt.plot(k,probability_bp,"g--",label="binomial") plt.title("Binomial and Normal distribution" + "(n,p="+str(n)+","+str(p)+")")#设置图片标题 plt.xlabel("Number of successes (k)")#设置图片x轴说明 plt.ylabel("probability")#设置图片y轴说明 plt.legend(loc=0)#将图例放在合适的位置,让系统自动查找
输出结果
通过图片可以看出,在 p p p值不变的情况下,随着试验次数 n n n的逐渐变大,二项分布逐渐趋近正态分布。所以在大样本情况下,可以用正态分布近似二项分布。
*** 参考资料 ***
1、《非寿险精算学》孟生旺著
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。