赞
踩
此篇为假设检验相关,涵盖的并不全面,后续会慢慢的完善,如有纰漏欢迎指正~
目录
1.《商务与经济统计》(原书第13版)
2.《校招面试考点全解析——数据分析师篇》
3.百度
假设检验是用统计数据判断命题真伪的方式。在统计学里,命题不能被证明是正确的,只能证明其否命题是错误的。
在假设检验中,我们首先对总体参数做一个尝试性的假设,该假设被称为原假设,记作,然后,定义另一个与原假设内容完全相反的假设,称之为备择假设,记作
,假设检验的过程就是根据样本数据来对这两个对立的假设进行检验的过程。一般来说,我们将想要推翻的假设作为原假设,而将想要检验证实的问题作为备择假设。
在这一步,我们需要根据总体标准差是否已知选择构建的统计量。
临界值是确定检验统计量的值是否小到足以拒绝原假设的一个基准, 即临界值是使得我们拒绝原假设的检验统计量的最大值。根据原假设的方式,有单侧拒绝域和双侧拒绝域。
双侧拒绝域:当原假设为=XX,这时候拒绝域在两侧,也叫做双侧检验。
单侧拒绝域:如果原假设有>XX,则拒绝域分布在左侧,称左侧检验;反之拒绝域分布在右侧,称右侧检验。
图中的 α即为事先给定的显著性水平,它代表了:当原假设为真时,检验统计量落在拒绝域,从而拒绝原假设的概率,也叫做第一类错误(弃真)。
在检验统计量的抽样分布中,检验统计量的临界值即为下侧面积α(显著性水平)相对应的值。
在双侧检验中,如果检验统计量或者
,则拒绝原假设;
在左侧检验中,如果检验统计量,则拒绝原假设;
在右侧检验中,如果检验统计量,则拒绝原假设。
即为进行假设检验中事先给定的显著性水平α,它代表了:当原假设为真时,检验统计量落在拒绝域,从而拒绝原假设的概率,也叫做弃真错误;
代表了:当原假设为假时,检验统计量落在拒绝域以外,从而接受原假设的概率,也叫做存伪。
虽然在假设检验中通常没有控制第二类错误,但我们应知道,α,β,样本量n直接存在以下三种关系:
其中第三条是最为重要的,它说明不能毫无必要地选择太小的显著性水平α,对于给定的样本容量,选择较小的显著性水平意味着将使发生第二类错误的风险增大。
p值和t值,z值一样,都是统计学中用于判断显著性的指标。它度量样本所提供的证据对原假设的支持程度,p-值越小说明拒绝原假设的证据越多。
可以将p值理解为原假设正确的概率,当p-值越小,
就越不可能正确。
p-值法的拒绝法则:如果p-值α,则拒绝
中心极限定理告诉我们,当抽样次数足够多时,样本的均值将围绕总体均值上下波动,而置信区间就是这个波动的范围,置信区间是在预先确定好的显著性水平下计算出来的,公式为:
,而置信度为1-α,综上可知置信区间与置信度是相互对应的。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。