赞
踩
目录
这一节来说一说假设检验,这是一个在统计学,量化领域很重要的一个概念。那么《统计推断基础》这个系列主章节主要是5部分,分别是:
之后还会有一些番外来详细说一些其他的问题。
还是那句话,重点在基础概念,基础不牢,地动山摇,不关你是做研究还是本科基础学习阶段,基础都是很重要的。
假设检验是估计的延伸。
假设检验的目的是利用证据拒绝假设。我们不是要证明或证实假设。你的目的是拒绝,不是肯定。所以这将会影响到之后原假设的设计。
因此,只有当我们能够成功地拒绝假设时,我们才能得到有意义的结论。
例如:
糖果产品的包装袋上写着“每包平均含有50块水果咀嚼片”。
作为消费者,你想要挑战这种说法。如何建立一个有数据支持的案例?
那么这就是一个假设检验问题。
就是有一个人说了一个观点,你觉得不靠谱,想要推翻他,然后你通过假设检验,数据分析的方法得到了证据,于是你拒绝了这个观点。
所以假设检验是反证思想。
原假设(null hypothesis)就是你想要去拒绝的那个观点,一般记作H0。
糖果产品的包装袋上写着“每包平均含有50块水果咀嚼片”。
作为消费者,你想要挑战这种说法。如何建立一个有数据支持的案例?
那么在这个例子中,你的原假设是µ = 50,所以H0:µ = 50
(1)明确假设:
H0:µ = 50
H1:µ ≠ 50
(2)确定非拒绝范围:
我们的默认非拒绝概率是95%,也就是说有95%的概率接受H0,此时的我们的偏差范围是±1.96SE
(3)确定错误概率
当我们计算后,发现这个值并不在非拒绝范围内,那么这就是错误概率,那么错误概率=1-非拒绝概率,这种错误发生的概率称为“α”。
α决定了错误拒绝真假设的最大概率。
(4)计算样本平均值和样本的标准差(SD)
假设我们计算出来是这样的:
n = 30(样本容量)
(5)计算标准误(SE)
(6)计算非拒绝域
(7) 下结论:
因为非拒绝域中不包含样本的均值52.4,所以我们拒绝接受H0,“每包水果的平均咀嚼次数不太可能是50个”。
为什么不在范围内就拒绝了?
我们来直观理解一下,我们设定的置信域为95%的情况下,也就是说样本的均值有95%的概率落在范围为48.783~51.217内,错误的概率只由5%,错误的概率很小了,但是很可惜,即使这么小的错误概率也发生了,52.4落在了范围之外,也就是说,“本来不可能发生的小概率事件发生了”,那么我们就可以说,你这个结论是假的,因为发生了小概率的事件。
只取1个样本作为证据(这个信息通常是给定的)检验叫做One-sample,刚刚的糖果例子就是one-sample。
你的两组应该是成对的(通常是同一组的两个观察值)。
例如:
观察100个人的体重。
你需要观察同一组人不同时间的体重值。
用图像形容就是:(Z-test与T-test没有本质区别,Z适用于更大样本,T适用于小样本)
什么时候用?
例如:两组人在1个月的体重(平均)下降有显著差异吗?
就是完全的两组,并不是一组人。
和上一个对比理解。
注意:不匹配成对测试计算SE的时候需要用以下公式:
例如:所有11岁孩子的平均身高是
1-tail 的假设样子如下:
注意:1-tail再计算比例的时候:
如果α = 5%那么就是单侧为5%不是2.5%
双尾假设总是定义为:
- H0中是一个等式
- H1中是一个不等式
例如:糖果问题:
H0:µ = 50
H1:µ ≠ 50
检测时因为是双尾,所以需要除以2,例如错误率为5%,那么你查表时就要查2.5%对应的Z值。
我们之后会专门出一个例题番外来详细介绍各个类别如何分析。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。