赞
踩
显著性水平(通常用α表示)是在进行假设检验时事先确定一个可允许的概率作为判断界限的小概率标准。检验中,依据显著性水平大小把概率划分为二个区间,小于给定标准的概率区间称为拒绝区间,大于这个标准则为接受区间。事件属于接受区间,原假设成立而无显著性差异;事件属于拒绝区间,拒绝原假设而认为有显著性差异。
通俗来讲,显著水平表示的是一个标准,即表示判断界限的小概率标准,往往显著性水平存在一定的人为因素,通常作为标准的小概率有0.1、0.05、0.01。有时人们也会使用显著性水平来检验假设是否成立,而用到的便是小概率事件。我们一般认为p-value≤0.05就可以认为假设是不成立的。0.05这个标准就是显著水平,当然选择多少作为显著水平也是主观的。
对显著水平的理解必须把握以下二点:
显著性水平检验属于假设检验的一种,应用的原理便是上面所说的显著性水平的原理,首先确定一个标准(即判断界限的小概率标准),一般取0.05(与后续的95%置信区间相对应)。当某个事件的发生概率小于这个概率时,事件属于拒绝区间,该事件具有显著性差异,拒绝原假设,即假设不成立。
H0是真实的 | H0是不真实的 | |
---|---|---|
拒绝H0 | 第Ⅰ类错误(α) | 正确 |
接受H0 | 正确 | 第Ⅱ类错误( β) |
简单举例:
在某次乒乓球赛中,对手提议通过抛硬币来决定谁先发球,“花”面朝上则对手先发球,反之则我。此时我认为这枚硬币是不公平的,而对手却说这枚硬币是公平的。这时我们可通过假设检验来验证这枚硬币是否公平。
假设 :这枚硬币是公平的
检验 :抛十次硬币,看是否符合假设。
反复抛硬币符合二项分布X∼B(n,μ),其中n代表扔硬币的次数,μ代表“花”朝上的概率。在硬币是公平的前提下,扔10次硬币应该符合以下分布:X∼B(10,0.5)。
总共扔了两次,都是“花”朝上,虽然几率是0.5x0.5 = 0.25,但是也正常,继续扔;总共扔了四次,也都是“花”朝上,几率是0.54=0.0625,感觉有点不正常,但是万一是运气呢?继续扔;总共扔了十次,也都是“花”朝上,那我就认为很可能你这枚硬币不是公平的。
那么当我们抛10次硬币,当出现多少次“花”面朝上就可以认为该硬币是不公平的,这是一个客观的判断,我们可结合显著性水平检验来判断。例如,我们可以计算抛10次硬币出现9次“花”面朝上的概率来检验我们的假设是否成立,这一事件的概率为P(9≤X≤10)=0.01≤0.05,表示出来如下图所示:
该事件属于显著性检验的拒绝区间,有显著性差异,拒绝原假设,即该硬币不公平。如果扔10次出现出现8次正面:P(8≤X≤10)=0.05,这个和我们的显著水平是一样的,我们也可以拒绝假设,只是没有那么“显著”了。综上所述,当需要检验一枚硬币是否公平时,可以连续抛十次,当出现八次以上的“花”面朝上就可以认为该硬币是不公平的。
参数检验的定义前面已介绍了,这里主要看一下几种常用的参数检验,包括t检验、f检验和z检验。
Z值 | p值 | 差异程度 |
---|---|---|
≥2.58 | ≤0.01 | 非常显著 |
≥1.96 | ≤0.05 | 显著 |
≤1.96 | ≥0.05 | 不显著 |
感冒人数 | 未感冒人数 | 合计 | 感冒率 | |
---|---|---|---|---|
喝牛奶组 | 43(39.3231) | 96(99.6769) | 139 | 30.94% |
不喝牛奶组 | 28(31.6848) | 84(80.3152) | 112 | 25.00% |
合计 | 71 | 180 | 251 | 28.29% |
喝牛奶组和不喝牛奶组的感冒率为30.94%和25.00%,两者的差别可能是抽样误差导致,也可能是 牛奶对感冒率真的有影响。 |
下面进行假设:假设喝牛奶对感冒发病率没有影响,即喝牛奶与感冒无关,所以感冒的发病率实际是(43+28)/(43+28+96+84)=28.29%。
根据上面的公式计算出x2=1.077,对于该问题V=1,查询可得临界值为3.84,x2=1.077<3.84,假设成立,即喝牛奶与感冒无关。
对于一到两组数据之间的总体均值的假设检验,使用T检验和Z检验就可实现,而对于两组以上的总体均值的假设检验则需要使用方差分析。当然对于三组及以上之间的总体均值的假设检验也可通过两两组合多次使用T检验和Z检验来实现,只不过比较麻烦,使用方差分析可以大大减少工作量,并且增强假设检验的稳定性。
【例】某公司采用四种方式推销其产品。为检验不同方式推销产品的效果,随机抽样得下表,不同的销售方式对销售量有影响吗?
方差分析的基本原理:将数据总的偏差平方和按照产生的原因分解成:(总的偏差平方和)=(由因素水平引起的偏差平方和)+(试验误差平方和);上式右边两个平方和的相对大小可以说明因素的不同水平是否使得各型号的平均维修时间产生显著性差异,为此需要进行适当的统计假设检验。上例中要看不同推销方式的效果,其实就归结为一个检验问题,设μi为第 i 种推销方式 i(i=1,2,3,4)的平均销售量,即检验原假设μ1=μ2=μ3=μ4是否为真。
从上【例】的表可以观察到,四个均值都不相等,方式二的销售量明显较大。然而,我们并不能简单地根据这种第一印象来否定原假设,而应该分析μ1、μ2、μ3、μ4之间差异的原因。20 个数据各不相同,这种差异可能由两方面的原因引起的:一是推销方式的影响,不同的方式会使人们产生不同消费冲动和购买欲望,从而产生不同的购买行动,这种由不同水平造成的差异,我们称为系统性差异;另一是随机因素的影响,同一种推销方式在不同的工作日销量也会不同,因为来商店的人群数量不一,经济收入不一,当班服务员态度不一,这种由随机因素造成的差异,我们称为随机性差异。
两个方面产生的差异用两个方差来计量:
单因素方差分析的数据结构
单因素方差分析的数据结构一般如下图所示:
在单因素方差分析中,若因素 A 共有 r 个水平,对均衡试验而言,每个水平的样本容量为 k,则共有 kr 个观察值,如上表所示。对不均衡试验,各水平中的样本容量可以是不同的,设第i个样本的容量是ni,则观测值的总个数为:
单因素方差分析的步骤
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。