主成分分析(PCA),又称最优线性无偏估计(OLS estimation of the best linear unbiased estimator)。它是一种利用最小均方误差(least squares error)的方法进行特征向量/主成分分析的技术。PCA通过对样本进行中心化和协方差计算,得到特征向量。在降维时,可以先保留一定比例的特征向量,然后将其他特征向量投影到上面。这样就可以有效地将高维数据转化为低维数据,同时还可以简化数据表示,提升数据分析的效率。
与PCA相对应的另一个重要的降维方法是SVD(singular value decomposition)。这是一种奇异值分解(singular value decomposition)的方法,它可以用来求