赞
踩
目录
这里介绍三种降维算法,先介绍一下各自的特点。
- 主成分分析主要是吧多个指标进行降维,只保留几个指标;
- 因子分析要优于主成分分析,因为因子分析比主成分分析好解释,主成分分析使用后不好解释,因子分析作用与主成分分析相同;
- 典型相关性分析的作用感觉有些局限(相比于以上两种算法),典型相关分析是研究两组变量之间相关关系的一种多元统计方法,它能够揭示出两组变量之间的内在联系,就是说在分别包含多个指标的两组数据中分别挑选出一个指标来代替自己那一组的数据,以此来进行分析两组数据的联系。
降维具有如下一些优点:
主成分分析是一种降维算法,它能将多个指标转换为少数几个主成分,这些主成分是原始变量的线性组合,且彼此之间互不相关,其能反映出原始数据的大部分信息。一般来说,当研究的问题涉及到多变量且变量之间存在很强的相关性时,我们可考虑使用主成分分析的方法来对数据进行简化。
主成分分析是把原来多个变量划为少数几个综合指标的一种统计分析方法。从数学角度来看,这是一种降维处理技术。
1.进行标准化处理
2.计算标准化样本的协方差矩阵
3.计算R的特征值和特征向量
4.计算主成分贡献率以及累计贡献率
5.写出主成分
6.根据系数分析主成分代表的含义
7.利用主成分的结果进行后续的分析
在主成分分析中,我们首先应保证所提取的前几个主成分的累计贡献率达到一个较高的水平,其次对这些被提取的主成分必须都能够给出符合实际背景和意义的解释。
主成分的解释其含义一般多少带有点模糊性,不像原始变量的含义那么清楚、确切,这是变量降维过程中不得不付出的代价。因此,提取的主成分个数m通常应明显小于原始变量个数p(除非p本身较小),否则维数降低的“利"可能抵不过主成分含义不如原始变量清楚的“弊"。
如果原始变量之间具有较高的相关性,则前面少数几个主成分的累计贡献率通常就能达到一个较高水平,也就是说,此时的累计贡献率通常较易得到满足。
主成分分析的困难之处主要在于要能够给出主成分的较好解释,所提取的主成分中如有一个主成分解释不了,整个主成分分析也就失败了。
主成分分析是变量降维的一种重要、常用的方法,简单的说,该方法要应用得成功,一是靠原始变量的合理选取,二是靠“运气"。
补充说明:因子计算权重
成分得分系数矩阵
线性组合系数及权重结果
1.KMO 和 Bartlett 的检验
2.方差解释率表格
3.旋转后因子载荷系数表格
4.碎石图
5.补充说明:因子计算权重
6.成分得分系数矩阵
7.载荷图
8.线性组合系数及权重结果
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。