当前位置:   article > 正文

生物统计分析之主成分分析(PCA)_什么数据适合主成分分析

什么数据适合主成分分析

简介

在医学统计中,尤其是在临床实验中,每个观测对象记录的观测结果包含多个反应变量(Respone Variables)。例如,血记录有收缩压、舒张压、脉压等,这种有多个变量的数据称为多变量数据。主成分分析是多变量分析方法中的一种分析方法,常见的多变量分析方法还包括多变量方差分析(Multivariate analysis of variance,MANOVA)、因子分析(Factor analysis)、典型相关(Canonical correlation analysis)、以及聚类分析(Cluster analysis)等。主成分分析(Principal Component Analysis,PCA)是一种掌握事物主要矛盾的统计分析方法,它可以从多元事物中解析出主要影响因素,揭示事物的本质,简化复杂的问题。计算主成分的目的是将高维数据投影到较低维空间。

主成分分析

主成分分析(Principal Component Analysis,PCA)通过将原始变量转换为原始变量的线性组合(主成分),在保留主要信息的基础上,达到简化和降维的目的。主成分与原始变量之间的关系主要有:

  1. 主成分是原始变量的线性组合。
  2. 主成分的数量相对于原始数量更少。
  3. 主成分保留了原始变量的大部分信息。
  4. 主成分之间相互独立。

主成分分析的优点

  1. 不要求数据呈正态分布,主成分就是按数据离散程度最大的方向对基组进行旋转,这个特性扩展了其应用范围。
  2. 通过对原始变量进行
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/weixin_40725706/article/detail/106821
推荐阅读
相关标签
  

闽ICP备14008679号