赞
踩
比如我们想研究一批灯泡的平均使用寿命,很显然我们不能获取全部灯泡的寿命做平均,只能通过抽样,用样本提供的信息来估计总体的特征。
参数估计parameter estimation就是用样本统计量去估计总体的参数。
在参数估计中,用来估计总体参数的统计量称为估计量estimator,比如样本均值、样本方差等。
根据一个具体的样本计算出来的估计量的数值称为估计值estimated value(估计量的具体取值,针对特定样本)
点估计point estimate:用样本统计量的某个取值直接作为总体参数的估计值。
虽然在重复抽样的条件下,点估计的均值可望等于总体真值(例如
E
(
x
ˉ
)
=
μ
E(\bar x)=\mu
E(xˉ)=μ),但对于一次采样来说,样本统计量的估计值很可能不同于总体真值。因此,在用点估计值代表总体参数值的同时,还必须给出点估计值的可靠性,也就是点估计值与总体参数的真实值接近的程度。
总体真值(参数)是靶心,一次抽样可以看做是一次射击,正好完美的命中靶心几率很小,但打在靶子上的可能性还是很大的。
我们以一次射击打中靶子的点作为圆心,画出一个区间,这个区间包含靶心(总体真值)的可能性很大。
区间估计interval estimate是在点估计的基础上,给出总体参数估计的一个区间范围,该区间通常由样本统计量加减估计误差得到。(下限,点估计,上限)根据样本统计量的抽样分布对样本统计量和总体参数的接近程度给出一个概率度量。
以总体均值的区间估计为例来说明区间估计的基本原理。
样本均值的抽样分布sampling distribution of the sample mean(近似正态分布)样本均值的数学期望等于总体均值
E
(
x
ˉ
)
=
μ
E(\bar x)=\mu
E(xˉ)=μ,样本均值的标准误差为
σ
x
ˉ
=
σ
/
n
\sigma_{\bar x}=\sigma/\sqrt n
σxˉ=σ/n
。可知样本均值
x
ˉ
\bar x
xˉ落在距离总体均值
μ
\mu
μ 1个抽样标准差范围内的概率为0.6827,2个抽样标准差范围内的概率为0.9545,3个抽样标准差范围内的概率为0.9973等。
在实际情况中,样本均值
x
ˉ
\bar x
xˉ是已知的(随机、已知),而总体均值
μ
\mu
μ是未知的(固定、未知)。样本均值
x
ˉ
\bar x
xˉ落在总体均值
μ
\mu
μ的两个标准差范围之内,反过来,总体均值
μ
\mu
μ也就被包括在以样本均值
x
ˉ
\bar x
xˉ为中心的两个标准差范围之内。即约有95%的样本均值
x
ˉ
\bar x
xˉ会落在总体均值
μ
\mu
μ的两个标准差范围之内,也可以说是,约有95%的样本均值
x
ˉ
\bar x
xˉ所构造的两个标准差区间会包括总体均值
μ
\mu
μ。
如果抽取100个样本来估计总体的均值,由100个样本所构造的100个区间中,约有95个区间包含总体均值,而另外的5个区间则不包含总体均值。
SD(standard deviation)标准差和SE(standard error)标准误差
标准差:反映数据的离散程度,比如经典的68-95-99.7法则。
标准误差:样本平均值的标准差。
区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间confidence interval,区间的最小值称为置信下限,最大值称为置信上限。
统计学家在某种程度上确信这个区间会包含真正的总体参数,所以取名为置信区间。
将构造置信区间的步骤重复多次,置信区间中包含总体参数真值的次数所占的比例称为置信水平confidence level,也称置信度或置信系数。在构造置信区间时,可以选用任意值作为置信水平,比较常用的有90%,95%,99%。
当样本量给定时,置信区间的宽度随着置信系数的增大而增大;
当置信水平固定时,置信区间的宽度随样本量的增大而减小。
用95%的置信水平得到某班学生考试成绩的置信区间为60-80分,不能说该班学生的平均成绩以95%的概率落在60-80分之间。因为总体真值是未知但固定的,它要么落在区间内,要么不落在区间内,不存在“以多大的概率落在区间内”的问题。正确的表述是如果做100次抽样,大概有95次找到的区间包含真值,有5次找到的区间不包含真值。
未完待续…
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。