当前位置:   article > 正文

统计案例 | 二战时期德军坦克数量的估计?_二战中的统计学

二战中的统计学

统计案例 | 二战时期德军坦克数量的估计?

一、一则故事

今天小编和各位同学来聊一则故事,在二战时期,西方盟国一直在努力确定德国的生产速度(典型的就是坦克产量),并以两种主要方式得到这个数据:常规情报收集统计估计

方式一是根据情报人员刺探的消息,这个好理解,各种影视剧中的间谍大家已经司空见惯。根据这种方式得到德军坦克每个月的产量大约有1400辆。(还挺多?)

方式二是根据盟军发现和截获的德国坦克数据,用统计分析办法得到。通过根据概率统计推断的方法,预计的数量只有数百辆(纳尼,差距这么大?)

那么问题来了?!方式一和方式二究竟哪个才是正确的?是情报人员技高一筹?还是科学的统计分析方法笑到了最后?以及方式二提到的统计分析方法又是指什么方法呢?欢迎走进“大型连续剧”—统计案例系列,听学长和你唠唠一些有意思的案例,以及案例背后所散发的统计思维(咳咳)。

二、点估计

“矩估计”想必各位小伙伴不陌生了,学过参数估计的小伙伴应该就了解,点估计是参数估计重要的一大类方法,而点估计方法又包括大家熟知的矩估计,以及接下来还要去提及的极大似然估计。

矩估计的定义是什么呢?首先来看“矩”的定义。在贾老师课本上,有这样一段话“在一般的概率论教材中,把数学期望及方差等概念用所谓“矩”的概念来描述”。具体的示例见下图,根据统计量的定义可以得知,XX矩本质就是统计量
在这里插入图片描述
那矩估计呢?说白了就是用上述XX矩来估计总体参数的方法。百度百科的定义为:利用样本矩来估计总体中相应的参数。首先推导涉及相关参数的总体矩(即所考虑的随机变量的幂的期望值)的方程。然后取出一个样本并从这个样本估计总体矩。接着使用样本矩取代(未知的)总体矩,解出感兴趣的参数。从而得到那些参数的估计。

是不是还有一些抽象?那举个栗子好了!

现在要估计总体均值,运用矩估计的方法来进行,那么“三部曲”走起:
在这里插入图片描述

上面我们大概了解了矩估计的含义,那这和一开始提到的预估坦克数量的故事有什么关系呢?

三、矩估计背后的故事

文章一开始提及的预估坦克数量的两种方式,到底哪个更准,当时的人们谁也说不清楚。等到二战结束之后,盟军对德国的坦克生产记录进行了检查,发现第二种方式,即统计方法预测的答案与事实更加符合! 具体见下图:
在这里插入图片描述
看来统计学还真有两把刷子欧!那接下来的问题就是,这些聪明的统计学家究竟是如何预估出来的呢?相信聪明的你已经猜到了,用到的方法就是刚才介绍过的矩估计
在这里插入图片描述
在当时,德国制造的每一辆坦克上都有一个序列号。假设德国每个月生产一批共N辆坦克,即从1到N顺序编号。所以,这个N也就是最大编号。盟军发现和截获的任何德国坦克上的序列号,都应该是介于1和N之间的一个整数。根据截获坦克序列号的数据来猜测总的生产数N,便是需要解决的问题。即估计总体参数N。

具体采用的方法是用不放回抽样来估计离散型均匀分布最大值。具体求解过程为:
在这里插入图片描述
注意:上述累加式子中为每两个数之间的数量,是不包括两个端点的值的。

来个实际例子:盟军发现了5辆坦克,其序列号分别为:

215、90、256、248、60。那么根据上述的方法,估计总的坦克数量为:
在这里插入图片描述
肿么样,是不是很有趣?类似的案例还有:

1、在二战期间,类似的序列号分析也在其他军事装备上应用过,其中最成功的属V-2火箭

2、二战期间,德国情报部门分析了苏联军事装备工厂,朝鲜战争期间苏联装备工厂也被分析过。苏联在二战期间也估计过德国坦克的生产数

3、20世纪80年代,一些美国人被获准进入以色列的梅卡瓦坦克的生产线。生产编号是分类过的,但水箱上有序列号,可以用来估计生产量。

4、该公式在非军事中也有使用,如估计Commodore 64计算机的总数,其结果(1.25亿)与官方数字相当匹配
在这里插入图片描述

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/知新_RL/article/detail/193079
推荐阅读
相关标签
  

闽ICP备14008679号