赞
踩
今天小编和各位同学来聊一则故事,在二战时期,西方盟国一直在努力确定德国的生产速度(典型的就是坦克产量),并以两种主要方式得到这个数据:常规情报收集和统计估计。
方式一是根据情报人员刺探的消息,这个好理解,各种影视剧中的间谍大家已经司空见惯。根据这种方式得到德军坦克每个月的产量大约有1400辆。(还挺多?)
方式二是根据盟军发现和截获的德国坦克数据,用统计分析办法得到。通过根据概率统计推断的方法,预计的数量只有数百辆(纳尼,差距这么大?)
那么问题来了?!方式一和方式二究竟哪个才是正确的?是情报人员技高一筹?还是科学的统计分析方法笑到了最后?以及方式二提到的统计分析方法又是指什么方法呢?欢迎走进“大型连续剧”—统计案例系列,听学长和你唠唠一些有意思的案例,以及案例背后所散发的统计思维(咳咳)。
“矩估计”想必各位小伙伴不陌生了,学过参数估计的小伙伴应该就了解,点估计是参数估计重要的一大类方法,而点估计方法又包括大家熟知的矩估计,以及接下来还要去提及的极大似然估计。
矩估计的定义是什么呢?首先来看“矩”的定义。在贾老师课本上,有这样一段话“在一般的概率论教材中,把数学期望及方差等概念用所谓“矩”的概念来描述”。具体的示例见下图,根据统计量的定义可以得知,XX矩本质就是统计量。
那矩估计呢?说白了就是用上述XX矩来估计总体参数的方法。百度百科的定义为:利用样本矩来估计总体中相应的参数。首先推导涉及相关参数的总体矩(即所考虑的随机变量的幂的期望值)的方程。然后取出一个样本并从这个样本估计总体矩。接着使用样本矩取代(未知的)总体矩,解出感兴趣的参数。从而得到那些参数的估计。
是不是还有一些抽象?那举个栗子好了!
现在要估计总体均值,运用矩估计的方法来进行,那么“三部曲”走起:
上面我们大概了解了矩估计的含义,那这和一开始提到的预估坦克数量的故事有什么关系呢?
文章一开始提及的预估坦克数量的两种方式,到底哪个更准,当时的人们谁也说不清楚。等到二战结束之后,盟军对德国的坦克生产记录进行了检查,发现第二种方式,即统计方法预测的答案与事实更加符合! 具体见下图:
看来统计学还真有两把刷子欧!那接下来的问题就是,这些聪明的统计学家究竟是如何预估出来的呢?相信聪明的你已经猜到了,用到的方法就是刚才介绍过的矩估计!
在当时,德国制造的每一辆坦克上都有一个序列号。假设德国每个月生产一批共N辆坦克,即从1到N顺序编号。所以,这个N也就是最大编号。盟军发现和截获的任何德国坦克上的序列号,都应该是介于1和N之间的一个整数。根据截获坦克序列号的数据来猜测总的生产数N,便是需要解决的问题。即估计总体参数N。
具体采用的方法是用不放回抽样来估计离散型均匀分布最大值。具体求解过程为:
注意:上述累加式子中为每两个数之间的数量,是不包括两个端点的值的。
来个实际例子:盟军发现了5辆坦克,其序列号分别为:
215、90、256、248、60。那么根据上述的方法,估计总的坦克数量为:
肿么样,是不是很有趣?类似的案例还有:
1、在二战期间,类似的序列号分析也在其他军事装备上应用过,其中最成功的属V-2火箭
2、二战期间,德国情报部门分析了苏联军事装备工厂,朝鲜战争期间苏联装备工厂也被分析过。苏联在二战期间也估计过德国坦克的生产数
3、20世纪80年代,一些美国人被获准进入以色列的梅卡瓦坦克的生产线。生产编号是分类过的,但水箱上有序列号,可以用来估计生产量。
4、该公式在非军事中也有使用,如估计Commodore 64计算机的总数,其结果(1.25亿)与官方数字相当匹配
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。