赞
踩
原标题:医学数据如果存在离群值应如何处理?spss箱式图解决——【杏花开医学统计】
离群值(outlier),指数据中与其他数值相比差异较大的数值。离群值具有极端或变异的特点,从直观上看似乎会与样本总体表现的有点格格不入,但是在进行医学统计时,在离群值产生的原因不明之前,不应简单决定其取舍,特别是当测量数据较少时,离群值的取舍对分析结果会产生很大影响,必须谨慎对待。
下面,我们来谈谈用spss箱式图处理医学数据中离群值的详细方法。
下方视频中有完整的理论讲解、spss中的操作步骤、分析结果的解读。看完就会了哦!
一、基本原理
箱式图,也称箱线图,其形状像箱子,用于表示数据的分散情况。箱式图可以展示出一组数据的最大值、最小值、中位数及上下四分位数。
箱式图中,最上方和最下方的线段分别表示数据的最大值和最小值,其中,箱式图的上方和下方的线段分别表示第三四分位数和第一四分位数,箱式图中间的粗线段表示数据的中位数。
二、判断方法
箱式图中在最上方和最下方的星号和圆圈分别表示样本数据中的异常值,即离群值。用SPSS软件描绘数据的箱式图,如果个体值距箱式图(box plot)底线(第一四分位线)或顶线(第三四分位线)的距离过大,一般为四分位数间距(箱体高度)的1.5倍至3倍时被视为离群点;而个体值距箱体底线或顶线的距离超过3倍的箱体高度时被视为离群值。
三、案例解读
(1)在SPSS中的具体操作
①依次点击“分析——描述统计——探索”。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。