赞
踩
假设检验(hypothesis testing),又称统计假设检验,也叫显著性检验,是用来判断样本与样本、样本与总体的差异是由抽样误差引起还是本质差异造成的统计推断方法。
显著性检验是假设检验中最常见的一种方法,也是一种最基本的统计推断形式。
其基本原理是:先对总体的特征做出某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还是接受做出推断。
对总体特征做某种假设,然后通过样本研究统计推理,最终对此假设做出接受或者拒绝的判断,常见的假设检验有:Z检验、t检验、F检验、卡方检验。
最常用的假设检验方法有U检验、T检验:
- U检验:当样本量较大时(一般指样本量大于30),使用U检验
- T检验:当样本量较小时(一般指样本量小于30),使用T检验
假设检验在AB实验中最为常见。
而互联网使用最多的是U检验,因为样本量大于30这个条件非常容易满足。
当然这里我们可能经常犯统计学中两种错误: 第一类错误(弃真):当H0为真时,我们拒绝了H0,发生的概率为α 第二类错误(取伪):当H0为假时,我们却接受了H0,发生的概率为β
- 1
- 2
- 3
理论上样本量越大越好,实际工作样本量越少越好。
这是因为样本量很少的情况下,实验结果可能被异常样本带偏,最终可能得到不准确的结果。但是使用样本量太大,相应的试错成本也会增大。
这里给大家推荐计算计算样本量的网站:Sample Size Calculator
其实样本量和红框中这四个影响因子有关,这里做简要的说明:
- 参数越大(比如10%),说明我们期望实验能够检测出10%的差别即可。检测这么大的差别当然比较容易(power变大),所以保持power不变的情况下,所需要的样本量会变小。
- 参数越小(比如1%),说明我们希望实验可以有能力检测出1%的细微差别。检测细微的差别当然更加困难(power变小),所以如果要保持power不变的话,需要的样本量会增加。
Statistical Significance:这参数为可以通过1-α得到
Statistical Power:这个参数可以通过1-β得到
对于某一具体的检验来说,当样本量n一定时,α越小,β越大。实际应用中通过增加样本量来减少β
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。