赞
踩
当总体是非正态分布且样本容量足够大时,使用正态分布来近似任何统计量的抽样分布。
两种应用:
•考虑从一个具有平均偏差μ和标准偏差σ的总体(任何总体)中选择的n个观察的随机样本。当n够大(n≥30)、
X
ˉ
\bar{X}
Xˉ的抽样分布将近似正态分布均值μ和标准差
σ
n
\frac{σ}{\sqrt{n}}
n
σ。象征性地,
X
ˉ
≈
(
μ
,
σ
n
)
\bar{X}\approx(\mu,\frac{σ}{\sqrt{n}})
Xˉ≈(μ,n
σ),近似。
•如果随机样本n是从正态整体中选取,则
X
ˉ
\bar{X}
Xˉ的抽样分布是正态分布;
X
ˉ
∼
(
μ
,
σ
n
)
\bar{X}\sim(\mu,\frac{σ}{\sqrt{n}})
Xˉ∼(μ,n
σ)精确。
X : 具有感兴趣特征的元素的数量是一个二项式随机变量, p ^ = x n \hat{p}=\frac{x}{n} p^=nx的抽样分布实际上遵循二项分布。如果样本大小是足够大的,那么可以用正常的经验法则来近似: n > 25,np > 5,以及 q = 1-p 的 nq > 5
随机变量标准化
例子
•如果X ~ Bin(n, p)且n足够大,则可近似为Y,其中
Y
∼
N
(
μ
=
n
p
,
σ
=
n
p
q
)
Y\sim N(\mu=np,\sigma=\sqrt{npq})
Y∼N(μ=np,σ=npq
)
•经验法则:n > 25, np > 5,和nq > 5
•校正连续性调整
•当离散分布近似为连续分布时,需要连续性校正。从离散随机变量X的值上加或减0.5是连续性校正。
•例如,如果X ~ Bin(n=100, p=0.7),近似p (X > 25)。
P(X > 25) = 1 - P(X≤25.5)≈1 - P(Y≤25.5)
eg.假设从一个正在进行的生产过程中随机获得n = 100个相同类型的轮胎样本,其中8%的轮胎是有缺陷的。
•在这样一个样品中有超过10个轮胎有缺陷的确切概率是多少?
•在这样一个样品中,缺陷轮胎超过10个的近似概率是多少?
零假设 Null Hypothesis (H0)
H0是普遍接受的事实
使用=号指定,即使≤或≥
示例,H0: μ= 3
备择假设 Alternative Hypothesis(H1)
与零假设相反
如果H0被拒绝,通常代表了一个新的理论(研究问题)。
总是不等号:<、>、或≠
示例,H1:μ< 3
假设检验的四种可能结果
临界值的方法 Critical value approach
如果测试统计量落在拒绝区域,则拒绝H0
P值即概率,反映某一事件发生的可能性大小。
假定值的方法 P-value approach
如果假定值<α则否定H0
α=P(I类错误)
α在检验开始前被指定
典型值是0.01、0.25、0.05、0.10(常用为 0.05)
置信区间的方法 Confidence interval approach
如果空值(在H0中指定的值)位于置信区间之外,则拒绝H0
对于每个假设检验,我们使用以下框架:
H
建立了两个假设:H0和H1。
A
陈述测试的假设,并证明这些假设从样本中是否有效。
T
陈述检验统计量,并且假设H0为真,它的分布。
说明哪些值反对H0。
找到测试统计量的观察值。
计算P值,表示在H0为真的情况下观察该样本(或更极端)的概率。
C
根据p值的大小权衡结论。
H
A
T
p
对于关于未知总体比例p的假设,我们执行以下步骤。
H H0: p = p0 vs H1: p < p0n次试验是独立的,概率为常数p。
T τ = X =在H0下成功的数量~ Bin(n, p0)
对于H1, x的小值会与H0争论。
观测值为x,
P P-value = P(x≤x)。
C衡量p值。经验法则是拒绝H0,因为p值< 0.05 =α。
P-values假定值:
如果备选假设是H1: p > p0,那么对于H1, x的较大值将与H0发生争论,因此对应的p值为p (X≥x)。
如果交替假设为双侧H1: p /= p0,那么对于H1, x的大小值都与H0相反,相关的p值为p (|x-np0|≥|x-np0|)。
在p0 = 12的特殊情况下,两边的p值降为
X > n/2时, P-value = 2P(X≥X)。
X < n/2时,P-value = 2P(X≤X)。
如果n很大,那么我们可以使用CLT(上周)来找到p值的近似值。我们找到近似的标准Y ~ N(np0, np0(1- p0)),然后使用R或标准化标准值并查找标准表。
IVF案例
符号检验是一种巧妙的方法,它有效地扩大了比例检验的适用性。它允许“比例”检验用于检验关于平均值或中位数的假设。
我们从H0:µ=µ0(或H0:˜µ=˜µ0)H0: p + = 0.5,通过考虑的比例差异的迹象{签署(ξµ0)}这是积极的。
注意:如果任何观测值等于零假设值xi = l0,则从样本中消除它们。这假设只有几个’ 0 ',因为它有效地减少了样本大小。
假设单个样本x1, x2,…, xn取未知类型的连续分布。
我们想测试H0:µ=µ0(或H0:˜µ=˜µ0)。
如果我们假设分布是对称的,那么如果H0成立,每个观测值都等可能在H0之上或之下。
考虑不同符号的集合sign(x1 - µ0),sign(x2 - µ0)… …sign(xn - µ0)
定义X =关于Bin(n, p+)的+号数量,其中p+ = p(+差)。
那么H0:µ=µ0 就等于H0:P+=0.5
符号测试步骤
案例:freeze dried coffee
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。