当前位置:   article > 正文

R语言稀疏主成分分析、因子分析、KMO检验和Bartlett球度检验分析上市公司财务指标数据...

r语句如何进行kmo检验

全文链接:http://tecdat.cn/?p=31080

R中的主成分分析(PCA)和因子分析是统计分析技术,也称为多元分析技术点击文末“阅读原文”获取完整代码数据)。

当可用的数据有太多的变量无法进行分析时,主成分分析(PCA)和因子分析在R中最有用,它们在不损害他们所传达的信息的情况下减少了需要分析的变量的数量。

我们和一位客户讨论过如何在R软件中实现稀疏主成分分析

稀疏主成分分析会把主成分系数(构成主成分时每个变量前面的系数)变的稀疏,也即是把大多数系数都变成零,通过这样一种方式,我们就可以把主成分的主要的部分凸现出来,这样主成分就会变得较为容易解释。

相关视频

上市公司财务分析指标数据

337cdf5db04c5e3431f484979eeeefe3.png

KMO检验和Bartlett球度检验

KMO检验

  1. kmo = function( data ){
  2. library(MASS)
  3. X <- cor(as.matrix(data))
  4. iX <- ginv(X)
  5. S2 <- diag(diag((iX^-1)))
  6. AIS <- S2%*%iX%*%S2

89137b2cbde3f1b355b8c41d6e8b8b6f.png

Bartlett球形检验:

bartlett(cor(data[,3:(ncol(data)-1)]

b00923e683d52e2d9caf7be3ca628619.png

相关性检验

输出相关系数矩阵

cor(data[,3:(ncol(data) )])

72836d11dce81ab77d28978a52a87195.png

绘制变量两两相关散点图

dd78c5ea4c7a47b306ea3dc77c274b37.png


点击标题查阅往期内容

be021ce499e086f127d6843a1ce607c5.png

R语言主成分PCA、因子分析、聚类对地区经济研究分析重庆市经济指标

outside_default.png

左右滑动查看更多

outside_default.png

01

081f3d77cb78a2083f7fac4b41d9250b.png

02

543d8ac3eaf59013b8e172af405ffbbc.png

03

690783dacfc6fd1ee16e1e78cc4f07f1.png

04

5d8e60ef9b5b054e273514a960d2c53e.png

稀疏主成分分析

  1. library(MASS)
  2. set.seed(1)
  3. #稀疏主成分分析建模
  4. nspc <- nsprc(data[,3:

9d8e54e7cea8cccdb6fb7d48df2188eb.png

主成分载荷

d45483a9dd8f8e1b7c4229f2a2497aca.png

绘制前两个主成分的载荷图

  1. plot(load ) # set up plot
  2. text(load,labels=names(mydata),ce

f11fbf6f6950e8b27edc29706ee447f2.png

因子分析

  1. library(psych)
  2. parallel

690a85d80d761036d9bad252f74bc98b.png

并行分析表明,因子数=8。

fit <- fa(r=cor

fc2c62acaea99eae5c395c446bbca752.png

因子载荷

7866a3ee4f5c2c9bac14eb5cc8935114.png

绘制前两个因子载荷

aec47b924cb4d855f4bb5e010084ab6b.png

绘制因子载荷矩阵

因子分析或主成分分析的结果用每个因子上的主要载荷来初步解释。这些结构可以用载荷表表示,也可以用图形表示,其中所有具有绝对值>某个切点的载荷都表示为边(路径)。

2fe9c72d1b84b90441f84ecf04008d2c.png


bda11e39b790277b52d2eaa796f7f72a.png

点击文末“阅读原文”

获取全文完整代码数据资料。

本文选自《R语言稀疏主成分分析、因子分析、KMO检验和Bartlett球度检验分析上市公司财务指标数据》。

点击标题查阅往期内容

R语言主成分PCA、因子分析、聚类对地区经济研究分析重庆市经济指标

数据分享|R语言用主成分PCA、 逻辑回归、决策树、随机森林分析心脏病数据并高维可视化

R语言逻辑回归logistic模型分析泰坦尼克titanic数据集预测生还情况

R语言是否对二分连续变量执行逻辑回归

R语言用lme4多层次(混合效应)广义线性模型(GLM),逻辑回归分析教育留级调查数据

R语言随机森林RandomForest、逻辑回归Logisitc预测心脏病数据和可视化分析

R语言基于Bagging分类的逻辑回归(Logistic Regression)、决策树、森林分析心脏病患者

R语言逻辑回归(Logistic回归)模型分类预测病人冠心病风险

R语言用局部加权回归(Lowess)对logistic逻辑回归诊断和残差分析

R语言用主成分PCA、 逻辑回归、决策树、随机森林分析心脏病数据并高维可视化

R语言用线性模型进行臭氧预测:加权泊松回归,普通最小二乘,加权负二项式模型,多重插补缺失值

R语言Bootstrap的岭回归和自适应LASSO回归可视化

R语言中回归和分类模型选择的性能指标

R语言多元时间序列滚动预测:ARIMA、回归、ARIMAX模型分析

R语言用lme4多层次(混合效应)广义线性模型(GLM),逻辑回归分析教育留级调查数据

R语言计量经济学:虚拟变量(哑变量)在线性回归模型中的应用

R语言 线性混合效应模型实战案例

R语言混合效应逻辑回归(mixed effects logistic)模型分析肺癌数据

R语言如何用潜类别混合效应模型(LCMM)分析抑郁症状

R语言基于copula的贝叶斯分层混合模型的诊断准确性研究

R语言建立和可视化混合效应模型mixed effect model

R语言LME4混合效应模型研究教师的受欢迎程度

R语言 线性混合效应模型实战案例

R语言用Rshiny探索lme4广义线性混合模型(GLMM)和线性混合模型(LMM)

R语言基于copula的贝叶斯分层混合模型的诊断准确性研究

R语言如何解决线性混合模型中畸形拟合(Singular fit)的问题

基于R语言的lmer混合线性回归模型

R语言用WinBUGS 软件对学术能力测验建立层次(分层)贝叶斯模型

R语言分层线性模型案例

R语言用WinBUGS 软件对学术能力测验(SAT)建立分层模型

使用SAS,Stata,HLM,R,SPSS和Mplus的分层线性模型HLM

R语言用WinBUGS 软件对学术能力测验建立层次(分层)贝叶斯模型

SPSS中的多层(等级)线性模型Multilevel linear models研究整容手术数据

用SPSS估计HLM多层(层次)线性模型模型

R语言高维数据的主成分pca、 t-SNE算法降维与可视化分析案例报告

R语言惩罚logistic逻辑回归(LASSO,岭回归)高维变量选择的分类模型案例

R语言有RStan的多维验证性因子分析(CFA)

主成分分析(PCA)原理及R语言实现及分析实例

R语言无监督学习:PCA主成分分析可视化

R语言使用Metropolis- Hasting抽样算法进行逻辑回归

R语言多元Logistic逻辑回归 应用案例

R语言自适应LASSO 多项式回归、二元逻辑回归和岭回归应用分析

R语言用逻辑回归、决策树和随机森林对信贷数据集进行分类预测

R语言基于树的方法:决策树,随机森林,Bagging,增强树

spss modeler用决策树神经网络预测ST的股票

R语言中自编基尼系数的CART回归决策树的实现

python在Scikit-learn中用决策树和随机森林预测NBA获胜者

matlab使用分位数随机森林(QRF)回归树检测异常值

基于随机森林、svm、CNN机器学习的风控欺诈识别模型

R语言惩罚logistic逻辑回归(LASSO,岭回归)高维变量选择的分类模型案例

R语言用标准最小二乘OLS,广义相加模型GAM ,样条函数进行逻辑回归LOGISTIC分

4d5639a9b3a53ba07187d1f554291448.png

efab6987134849b2e161f82a515fb3e1.jpeg

3aef79366081f7726a82ab025f7bd91d.png

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/繁依Fanyi0/article/detail/94189
推荐阅读
相关标签
  

闽ICP备14008679号