当前位置:   article > 正文

人工智能数学基础之概率论_人工智能数学实验

人工智能数学实验

基础概念

随机试验

试验是指为了观察某事的结果或某物的性能而从事的某种活动。在概率论中,一个试验如果具有以下3个特点:

  1. 可重复性:在相同条件下可以重复进行
  2. 可观察性:每次实现的可能结果不止一个,并且能事先明确实验的所有可能结果
  3. 不确定性:一次试验之前,不能预知会出现哪一个结果

这样的试验是一个随机试验,简称为试验

样本点和样本空间

每次试验的每一个结果成为基本事件,也称作样本点,记作 w 1 , w 2 , ⋯ w_1,w_2,\cdots w1,w2,, 全部样本点的集合成为样本空间,记作 Ω \Omega Ω,则 Ω = { w 1 , w 2 , ⋯   } \Omega=\{w_1,w_2,\cdots\} Ω={w1,w2,}

假设掷一颗均匀骰子,观察出现的点数。这是一个随机试验,样本空间 Ω = { 1 , 2 , 3 , 4 , 5 , 6 } \Omega=\{1,2,3,4,5,6\} Ω={1,2,3,4,5,6}

随机事件

基本事件是不可再分解的、最基本的事件,其他事件均可由它们复合而成,由基本事件复合而成的事件称为随机事件或简称为事件
常用大写字母 A , B , C A,B,C A,B,C等表示事件。不如 A = { 出现的点数为偶数 } = { 2 , 4 , 6 } A=\{出现的点数为偶数\}=\{2,4,6\} A={出现的点数为偶数}={2,4,6}

随机事件的概率

概率是用来描述随机事件发生的可能性大小。比如抛硬币的试验,抛得次数越多,出现正面的 次数与投掷次数之间的比例愈加趋于 0.5 0.5 0.5。它的数学定义为:

在多次重复试验中,若事件 A A A发生的频率稳定在常数 p p p附近摆动,且随着试验次数的增加,这种摆动的幅度是很微小的。则称确定常数 p p p为事件 A A A发生的概率,记作 P ( A ) = p P(A)=p P(A)=p

例子
设一年有365天,求下列事件 A , B A,B A,B的概率:
A = { n 个人中没有 2 人同一天生日 } B = { n 个人中有 2 人同一天生日 } A = \{n个人中没有2人同一天生日\} B = \{n个人中有2人同一天生日\} A={n个人中没有2人同一天生日}B={n个人中有2人同一天生日}


显然事件 A , B A,B A,B是对立事件,有 P ( B ) = 1 − P ( A ) P(B)=1 - P(A) P(B)=1P(A)
由于每人的生日可能是365天的任意一天,因此, n n n个人的生日有 36 5 n 365^n 365n种可能结果,而且每种结果是等可能的,因而是古典概型,事件 A A A的发生必须是 n n n个不同的生日,因而 A A A的样本点数为从 365 365 365中取 n n n个的排列数 P 365 n P^n_{365} P365n,于是

P ( A ) = P 365 n 36 5 n P ( B ) = 1 − P ( A ) = 1 − P 365 n 36 5 n P(A) = \frac{P^n_{365}}{365^n} \\ P(B) = 1 - P(A) = 1 - \frac{P^n_{365}}{365^n} P(A)=365nP365nP(B)=1P(A)=1365nP365n

条件概率

A , B A,B A,B是两个事件,且 P ( A ) > 0 P(A)>0 P(A)>0,则称
P ( B ∣ A ) = P ( A B ) P ( A ) P(B|A) = \frac{P(AB)}{P(A)} P(BA)=P(A)P(AB)
为在事件 A A A发生的条件下,事件 B B B条件概率
P ( A B ) P(AB) P(AB)表示 A , B A,B A,B这两个事件同时发生的概率。

例子
某种原件用满 6000 h 6000h 6000h未坏的概率是 3 / 4 3/4 3/4,用满 10000 h 10000h 10000h未坏的概率是 1 / 2 1/2 1/2,现有一个此种元件,已经用过 6000 h 6000h 6000h未坏,试求它能用到 10000 h 10000h 10000h的概率。

A A A表示 { 满 10000 h 未坏 } \{满10000h未坏\} {10000h未坏}, B B B表示 { 满 6000 小时未坏 } \{满6000小时未坏\} {6000小时未坏},则
P ( B ) = 3 / 4 , P ( A ) = 1 / 2 P(B)=3/4,P(A)=1/2 P(B)=3/4,P(A)=1/2

由于 B ⊃ A , A B = A B \supset A,AB=A BA,AB=A,因而 P ( A B ) = 1 / 2 P(AB)=1/2 P(AB)=1/2,因此,
P ( A ∣ B ) = P ( A B ) P ( B ) = 1 2 3 4 = 2 3 P(A|B)=\frac{P(AB)}{P(B)} = \frac{\frac{1}{2}}{\frac{3}{4}}=\frac{2}{3} P(AB)=P(B)P(AB)=4321=32

解释一下,这里由于事件 A A A包括事件 B B B的。

事件的独立性

如果事件 B B B发生的可能性不受事件 A A A发生与否的影响,即
P ( B ∣ A ) = P ( B ) P(B|A)=P(B) P(BA)=P(B)
则称事件 B B B对于事件 A A A独立,显然,若 B B B A A A对立,则 A A A B B B也一定独立,称事件 A A A与事件 B B B相互独立。

例子
口袋里装有5个黑球与3个白球,从中有放回地取2次,每次取一个,设事件 A A A表示第一次取到黑球,事件 B B B表示第二次取到黑球,则有
P ( A ) = 5 8 , P ( B ) = 5 8 , P ( A B ) = 5 8 × 5 8 = 25 64 P(A)=\frac{5}{8},P(B)=\frac{5}{8},P(AB)=\frac{5}{8} \times \frac{5}{8} = \frac{25}{64} P(A)=85,P(B)=85,P(AB)=85×85=6425

因而
P ( B ∣ A ) = P ( A B ) P ( A ) = 5 8 P(B|A) = \frac{P(AB)}{P(A)} = \frac{5}{8} P(BA)=P(A)P(AB)=85
因此, P ( B ∣ A ) = P ( B ) P(B|A) = P(B) P(BA)=P(B),这表明无论 A A A是否发生,都对 B B B发生的概率无影响。事件 A , B A,B AB相互独立

性质

事件 A A A和事件 B B B相互独立的充分必要条件是
P ( A B ) = P ( A ) P ( B ) P(AB)=P(A)P(B) P(AB)=P(A)P(B)

全概率公式

如果事件 A 1 , A 2 , ⋯   , A n A_1,A_2,\cdots,A_n A1,A2,,An是一个完备事件组(一个事件发生的所有可能性都在这里面),并且都有正概率,则有
P ( B ) = P ( A 1 ) P ( B ∣ A 1 ) + P ( A 2 ) P ( B ∣ A 2 ) + ⋯ + P ( A n ) P ( B ∣ A n ) = ∑ i = 1 n P ( A i ) P ( B ∣ A i ) P(B)=P(A_1)P(B|A_1)+P(A_2)P(B|A_2)+\cdots+P(A_n)P(B|A_n) = \sum_{i=1}^nP(A_i)P(B|A_i) P(B)=P(A1)P(BA1)+P(A2)P(BA2)++P(An)P(BAn)=i=1nP(Ai)P(BAi)

对于任何事件 B B B,事件 A A ‾ A\overline{A} AA构成最简单的完备事件组,根据全概率公式得
P ( B ) = P ( A B + A ‾ B ) = P ( A B ) + P ( A ‾ B ) = P ( A ) P ( B ∣ A ) + P ( A ‾ ) P ( B ∣ A ‾ ) P(B)=P(AB+\overline{A}B)=P(AB)+P(\overline{A}B)=P(A)P(B|A)+P(\overline{A})P(B|\overline{A}) P(B)=P(AB+AB)=P(AB)+P(AB)=P(A)P(BA)+P(A)P(BA)

贝叶斯公式

设事件 A 1 , A 2 , ⋯   , A n A_1,A_2,\cdots,A_n A1,A2,,An是一个完备事件组,则对任一事件 B B B P ( B ) > 0 P(B)>0 P(B)>0,有
P ( A i ∣ B ) = P ( A i B ) P ( B ) = P ( A i ) P ( B ∣ A i ) ∑ i = 1 n P ( A i ) P ( B ∣ A i ) P(A_i|B)=\frac{P(A_iB)}{P(B)}=\frac{P(A_i)P(B|A_i)}{\sum^n_{i=1}P(A_i)P(B|A_i)} P(AiB)=P(B)P(AiB)=i=1nP(Ai)P(BAi)P(Ai)P(BAi)

以上公式就叫贝叶斯公式,可由条件概率的定义及全概率公式证明。

例子
市场上供应的某种商品由甲、乙、丙3个厂商生存,甲厂占45%,乙厂占35%,丙厂占20%。如果各厂的次品率依次为4%,2%,5%。现从市场上购买1件这种商品,发现是次品,试判断它是由甲厂生产的概率。

设事件 A 1 , A 2 , A 3 A_1,A_2,A_3 A1,A2,A3,分别表示商品由甲、乙、丙厂生产的,事件 B B B表示商品为次品,得概率
P ( A 1 ) = 0.45 , P ( A 2 ) = 0.35 , P ( A 3 ) = 0.20 P ( B ∣ A 1 ) = 0.04 , P ( B ∣ A 2 ) = 0.02 , P ( B ∣ A 3 ) = 0.05 P(A_1)=0.45,P(A_2)=0.35,P(A_3)=0.20 \\ P(B|A_1) = 0.04,P(B|A_2)=0.02,P(B|A_3)=0.05 P(A1)=0.45,P(A2)=0.35,P(A3)=0.20P(BA1)=0.04,P(BA2)=0.02,P(BA3)=0.05

根据贝叶斯公式,可得:
P ( A 1 ∣ B ) = P ( A 1 B ) P ( B ) = P ( A 1 ) P ( B ∣ A 1 ) P ( A 1 ) P ( B ∣ A 1 ) + P ( A 2 ) P ( B ∣ A 2 ) + P ( A 3 ) P ( B ∣ A 3 ) = 0.45 × 0.04 0.45 × 0.04 + 0.35 × 0.02 + 0.2 × 0.05 ≈ 0.514 P(A_1|B)=\frac{P(A_1B)}{P(B)} = \frac{P(A_1)P(B|A_1)}{P(A_1)P(B|A_1)+P(A_2)P(B|A_2) + P(A_3)P(B|A_3)} \\ = \frac{0.45\times 0.04}{0.45 \times 0.04 + 0.35\times 0.02 + 0.2 \times 0.05} \approx 0.514 P(A1B)=P(B)P(A1B)=P(A1)P(BA1)+P(A2)P(BA2)+P(A3)P(BA3)P(A1)P(BA1)=0.45×0.04+0.35×0.02+0.2×0.050.45×0.040.514

在购买一件商品这个试验中, P ( A i ) P(A_i) P(Ai)是在试验以前就已经知道的概率,所以习惯地称为先验概率。试验结果出现了次品,这时条件概率 P ( A i ∣ B ) P(A_i|B) P(AiB)反映了在试验以后对 B B B发生的来源(次品的来源)的各种可能性的大小,称为后验概率

随机变量

在引入随机变量之前先来看下三元组的概念,三元组 ( Ω , F , P ) (\Omega, \mathcal F,P) (Ω,F,P)——上帝视角,来自《程序员的数学2》,值得一读,以一种全新的视角来讲解概率论知识。将概率看成是一种测度,测度可以理解为面积与体积等可测量的量的泛化概念。

在这里插入图片描述
借助平行世界的概念,有很多个平行世界,每个世界中发生的事件并不相同,比如骰子在一个世界中的结果为1,在另一个世界中则是5。但这些世界中的结果有预先的剧本——我们假定每个世界都会准备专用的剧本。即,对于某个特定的纾解来说,所有的结果都已确定,不存在任何随机事件。

以计算抛硬币 本文内容由网友自发贡献,转载请注明出处:【wpsshop博客】

推荐阅读
相关标签