赞
踩
此篇文章是我在B站学习时所做的笔记,部分为亲自动手演示过的,方便复习用。此篇文章仅供学习参考。
提示:以下是本篇文章正文内容,下面案例可供参考
为了方便记忆,变量名最好与其代表的数据含义相对应。变量名是变量存取的唯一标志。在定义SPSS数据文件结构时应首先给出每列变量的变量名。
数值宽度就是输入字符的个数
变量名标签是对变量名含义的进一步解释说明,它可增强变量名的可视性和统计分析结果的可读性。
离散缺失值就是设置这几个值 系统分析时碰到当做缺失值处理,缺失值的产生是由于明显错误或者不合理的数据
度量:又称定距变量或刻度变量,一般为有刻度度量的连续变 量,它的取值之间可以比较大小,且可以定义距离,是可以加减乘除的变量。例如“年龄”、“年份”等。
有序:一种分类变量,但是变量取值之间有内在的大小顺序或 等级。例如“满意度”变量的取值为1-很不满意、2-比较满意、 3-非常满意,由小到大的取值代表满意度的提高。有序也是定序变量,变量之间不仅有类别之差,还有固有的顺序,比如年龄组 老中青
名义变量就变量与变量之间只存在类型的差距,没有排序,名义只有名称,不能比大小,比如男女
输入——代表自变量,因为自变量是需要输入的。
分区和拆分两者用的不多,基本上不会使用的
自己选择文件格式,范围也可以自己选择
数据转置:将数据编辑窗口中数据的行列互换,即将个案转为变量,变量转为个案后,重新显示在数据编辑窗口
原来的数据显示:
操作:选中第1个按住shift选中最后一个即可全选
结果:
如果未全选,会丢失数据
先同时打开两个文件。
结果:
打开两个文件
原数据显示:
等于把一个人测的六次数据从变量变成了个案,用批次表示
再选一次(成绩)的原因是不止要统计成绩的平均值,还要统计最大值、最小值等等
个案数:表示在分类结果中,用一个变量显示每个分类类别中观测量的个数
这里保存框里选择创建那一行,输出的结果就是只有那四种组合
汇总的是相同性别和类型学生的成绩
原数据显示:
最后一列N_BREAK代表性别和学生类型相同的的个数,如:第一行性别和学生类型都为2的总共有19个。
根据指定的分组变量对原始数据进行分组,使得分组变量取值向量的个案集中在一块儿,有利于比较和观察。
比较组:指将文件拆分后的分组以比较组的形式显示。
按组织输出:指按分组变量的取值排序输出。
拆分文件会一直起作用,即无论进行哪种统计分析,都是按拆分变量的不同组分别进行分析计算,如果希望对所有数据进行整体分析,则需要重新进行数据拆分。和排序有区别 排序后分析是总体分析,拆开后分析可以只分析性别1学生类别2的个案
原数据显示:
原数据显示:
结果:
结果:filter=1的就是符合if条件的
结果:filter=1的就是符合所选样本条件的
结果:(未开启过滤器)
结果:重新生成新的数据集
结果:只在原数据集中把慢性咽炎留住,其他给删除了
原数据显示:
结果不对
结果正确:
计算新变量的原因:好多变量不是对原变量进行分析的
原数据显示:
原数据显示:
结果:在选定好的测定地点1中显示数据,健康列在健康等级为1和2的所在行显示1,在健康等级为3的所在行显示0
原数据显示:
结果:
结果:新变量3和新变量4相当于按拼音字母或者数字顺序重新用数字序号排列。那张飞为什么和张三的数值是不一样的?因为第二个字是F和S,这样的作用可能是可以按字母排序,飞f比三s顺序靠前一点,这个自动排序就是依次按123456排下去的。
R全氮、R全磷、R全钾就是按升序排序,把排名表示出来。
原数据显示:
结果:
原数据显示:
结果:
探索性分析 的作用:能对数据进行过滤和检查,能识别离群值啊,极值,数据中的【缺口】及其他特征。他能验证数据的分布特征,正态分布和方差齐不齐性。对不满足的数据能提示转化方法。能描述统计量。
使用“探索”过程有很多原因:数据过滤、离群值识别、描述、假设检验以及描述子群体(个案组)之间差异的特征。
因变量列表填需要探索的变量,因子列表表示分类
因子是自变量或影响因子。
5%截尾平均值:是排除掉数据首尾两端5%的变量值后得出的平均值。
M统计量是利用迭代方法计算出来,一般来说受异常值影响要小的多。如果该统计量离均数和中位数较远,则说明数据中可能存在异常值,此时宜用该估计值替代均数以反映集中趋势。
最开始置信区间设置的是95%,所以小于5%的当然不是了
原数据显示:
列联表分析经常用来分析问卷调查的数据,可以比较好地反映出两个因素之间有无关联性,两个因素与现象之间的相关关系。
这个案例只有分析2个变量,如果增加一个年龄段变量,这个年龄段变量可以作为层变量,分析各个年龄段内性别与满意度是否相关
蒙特卡洛(Monte Carlo)模拟是一种通过设定随机过程,反复生成时间序列,计算参数估计量和统计量,进而研究其分布特征的方法。
卡方包括皮尔逊卡方检验,斯皮罗卡方检验,当两个表变量都是定量时,用来检验行变量和列变量之间是否相关。
相关性:用来测量等级顺序之间的相关性,当两个表变量都是定量变量的时候,就会产生pearson相关系数,就是变量之间线性相关性的测量。
lambda:以自变量来预测因变量可以消减百分之多少的误差
原数据显示:
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。