赞
踩
1.数据预处理:对给定数据进行规范化(中心化处理),使得每一变量的平均值为0,方差为1
2.对数据进行正交变换:
原来由线性相关变量表示的数据通过正交变换变成由若干个线性无关的新变量表示的数据,新变量是可能的正交变换中变量的方差的和最大的,方差表示在新变量上信息的大小
(1)计算协方差矩阵:协方差矩阵描述了不同特征之间的相互关系
(2)求解特征值和特征向量:特征值表示对应特征向量方向上的方差大小,特征向量则定义了新的坐标轴方向
(3)选择主成分:根据特征值的大小选择前k个最大的特征值对应的特征向量作为主成分
(4)数据降维:将原始数据投影到选定的主成分构成的新坐标系中,得到降维后的数据
3.找到数据分布最分散的方向(方差最大) 作为主成分(坐标轴)
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。