当前位置:   article > 正文

R语言、WEKA从数据角度看员工为什么离职?

R语言、WEKA从数据角度看员工为什么离职?

原文链接:http://tecdat.cn/?p=3986

马云说:“员工离职的原因总是只有两个:钱,没有到位;心委屈了。”

点击文末“阅读原文”获取完整代码数据)。

相关视频

现在很多老板都抱怨说,年轻人的流动率太高了,员工觉得老板的钱太少了,最后还是多指责。

为什么我们最好和最有经验的员工过早离职?

到底如何解决这个困境?拓端数据tecdat使用数据分析员工离开的原因,希望能从中找到线索。

我们搜集的数据包含:

l能力评估

l项目数量

l平均每月工作时间/小时

l花在公司的时间

l是否有工作意外

l是否在过去5年里进行了推广

l部门

l薪水

l员工是否离开

1f7aa195a706e7cfa162de20ef49ffc6.png

1 判断哪些员工做出了较大贡献

为了判断哪些员工做出了较大贡献,我们需要得到一个判断的规则.

因此在这里我们将使用evaluation来代表哪些员工作出贡献的衡量标准,

为了得到判断的规则,我们要使用决策树模型.

决策树模型的概念如下:

决策树(decision tree)是一个树结构(可以是二叉树或非二叉树)。其每个非叶节点表示一个特征属性上的测试,每个分支代表这个特征属性在某个值域上的输出,而每个叶节点存放一个类别。使用决策树进行决策的过程就是从根节点开始,测试待分类项中相应的特征属性,并按照其值选择输出分支,直到到达叶子节点,将叶子节点存放的类别作为决策结果。

然后我们需要evaluation作为决策树的因变量,将其他的员工特征作为输入变量,然后我们可以得到决策树的规则,从而判断哪些变量可以判断员工作出了贡献

我们查看模型的结构

2baac5dc914601029a84dc972796522f.png


点击标题查阅往期内容

010a8e3ac25f3bd613ef32865bc0b81b.jpeg

数据分享|R语言用主成分PCA、 逻辑回归、决策树、随机森林分析心脏病数据并高维可视化

outside_default.png

左右滑动查看更多

outside_default.png

01

de1d525f6fa1030d1752a3f094e9dc36.png

02

0216847482df8cf592092bc35fa3477c.png

03

c9e015cc9ad3a5f4718c2f4c608d1147.png

04

ec2831919c676ba3e1ad4aea6e129d33.png

从上面的结果来看,我们可以看到树的节点有平均工作时间,在公司所花的时间,满意程度,这几个变量.因此我们可以通过这些变量来判断一个人供是否对公司做出了贡献.从第一个节点我们可以看到,如果每月的平均工作小时小于零一百六十个小时的话,那么他的贡献,在78%左右,也就是平均贡献非常低.如果工作时间大于160个小时,我们要看他在公司所花的时间.如果公司所花的时间大于3.5.那么他对公司做出的贡献在81%左右.如果在公司所花的时间不足3.5.那么我们就要判断他对公司的满意程度.因此从上面的结果中我们可以看到,在公司所花的时间越多,那么这个人对公司的贡献可能略大,公司的满意程度较低,,说明他认为公司的可提高空间还很大,因此他对公司的贡献也会较大.

2 哪些原因会导致员工离职

然后我们是用同样的方法来判断哪些原因会导致员工的离职,在这里我们使用员工是否离职作为因变量.

我们查看模型的结果

0579056d562b6c71dc2514f8b0a14ec0.png

从结果中,我们可以看到有一些变量重复的出现,比如对公司的满意程度,在公司所花的时间所做的工程数量,最后的评估结果.因此可以认为这些变量对员工是否离职产生了重要的影响.

c2b792d42a913f5901e7146f3dcc5eff.png

同时我们还可以得到对员工是否离职的影响的一个决策树方程

从上面的结果来看,我们可以发现,系数如果是负的那么说明这个,这个变量对于是否离职有负相关的作用,如果系数是正的,那么这个变量对员工是否与此产生了正相关的作用.那么从上面的结果中我们就可以看到,如果一个员工对公司的满意程度越高,那么他离职的可能性就越小,如果一个员工最后的评估成绩越高,那么他离职的可能性也越小,如果他做过的项目数量越多,那么他离职的可能性也越小,同时我们可以看到,如果他的薪水较低,那么他离职的可能性就越大.同时我们还可以看到,一个人的岗位,还有他平均的工作时间,对她是否离职似乎没有影响.

3 能否通过加薪升职等方式挽留那些做出贡献的员工 ?

93c5709e6637f50b59ef331d9ffeb274.png

那么是否可以通过升职加薪的方式挽留作出贡献的员工呢?

从上面的方程来看,答案是肯定的.

因为一个人的薪水越低,那么他离职的可能性就越高,因此如果增加一个人的薪水,那么会降低他的离职概率.同时从系数的大小我们还可以判断,如果一个人的职位是i t部门那么他的离职可能性会较小。同时我们可以看到,如果公司对它的最后评估越高,那么他离职的可能性也越小,因此我们可以通过升职加薪的方式来挽留作出贡献的员工。

提高教育水平,使年轻人具有中产阶级价值观和更高的自我期望。但高等教育的普及也导致了中产阶级价值实行变得困难。这就像能买得起票的人变得更多,结果不是每个人都可以上车。因此,有时我们要调整对工作的预期,做好眼前的事情。


cf74a8ca4e2a0fc4167918a5a2b7332d.png

点击文末“阅读原文”

获取全文完整代码数据资料。

本文选自《R语言、WEKA从数据角度看员工为什么离职?》。

e51f7840c116f7343f0179b8d593af6a.jpeg

1c34833e85ebb35cf29448ffb5782ba1.png

点击标题查阅往期内容

R语言逻辑回归logistic模型分析泰坦尼克titanic数据集预测生还情况

R语言是否对二分连续变量执行逻辑回归

R语言用lme4多层次(混合效应)广义线性模型(GLM),逻辑回归分析教育留级调查数据

R语言随机森林RandomForest、逻辑回归Logisitc预测心脏病数据和可视化分析

R语言基于Bagging分类的逻辑回归(Logistic Regression)、决策树、森林分析心脏病患者

R语言逻辑回归(Logistic回归)模型分类预测病人冠心病风险

R语言用局部加权回归(Lowess)对logistic逻辑回归诊断和残差分析

R语言用主成分PCA、 逻辑回归、决策树、随机森林分析心脏病数据并高维可视化

R语言用线性模型进行臭氧预测:加权泊松回归,普通最小二乘,加权负二项式模型,多重插补缺失值

R语言Bootstrap的岭回归和自适应LASSO回归可视化

R语言中回归和分类模型选择的性能指标

R语言多元时间序列滚动预测:ARIMA、回归、ARIMAX模型分析

R语言用lme4多层次(混合效应)广义线性模型(GLM),逻辑回归分析教育留级调查数据

R语言计量经济学:虚拟变量(哑变量)在线性回归模型中的应用

R语言 线性混合效应模型实战案例

R语言混合效应逻辑回归(mixed effects logistic)模型分析肺癌数据

R语言如何用潜类别混合效应模型(LCMM)分析抑郁症状

R语言基于copula的贝叶斯分层混合模型的诊断准确性研究

R语言建立和可视化混合效应模型mixed effect model

R语言LME4混合效应模型研究教师的受欢迎程度

R语言 线性混合效应模型实战案例

R语言用Rshiny探索lme4广义线性混合模型(GLMM)和线性混合模型(LMM)

R语言基于copula的贝叶斯分层混合模型的诊断准确性研究

R语言如何解决线性混合模型中畸形拟合(Singular fit)的问题

基于R语言的lmer混合线性回归模型

R语言用WinBUGS 软件对学术能力测验建立层次(分层)贝叶斯模型

R语言分层线性模型案例

R语言用WinBUGS 软件对学术能力测验(SAT)建立分层模型

使用SAS,Stata,HLM,R,SPSS和Mplus的分层线性模型HLM

R语言用WinBUGS 软件对学术能力测验建立层次(分层)贝叶斯模型

SPSS中的多层(等级)线性模型Multilevel linear models研究整容手术数据

用SPSS估计HLM多层(层次)线性模型模型

R语言高维数据的主成分pca、 t-SNE算法降维与可视化分析案例报告

R语言惩罚logistic逻辑回归(LASSO,岭回归)高维变量选择的分类模型案例

R语言有RStan的多维验证性因子分析(CFA)

主成分分析(PCA)原理及R语言实现及分析实例

R语言无监督学习:PCA主成分分析可视化

R语言使用Metropolis- Hasting抽样算法进行逻辑回归

R语言多元Logistic逻辑回归 应用案例

R语言自适应LASSO 多项式回归、二元逻辑回归和岭回归应用分析

R语言用逻辑回归、决策树和随机森林对信贷数据集进行分类预测

R语言基于树的方法:决策树,随机森林,Bagging,增强树

spss modeler用决策树神经网络预测ST的股票

R语言中自编基尼系数的CART回归决策树的实现

python在Scikit-learn中用决策树和随机森林预测NBA获胜者

matlab使用分位数随机森林(QRF)回归树检测异常值

基于随机森林、svm、CNN机器学习的风控欺诈识别模型

R语言惩罚logistic逻辑回归(LASSO,岭回归)高维变量选择的分类模型案例

R语言用标准最小二乘OLS,广义相加模型GAM ,样条函数进行逻辑回归LOGISTIC分类

67373f8569a8893f4cf2a9fa3a048e75.png

eb884015ee2db675a6bd2a0801f16c25.jpeg

2b4dad48c143ba15a6da36a59fcaf47f.png

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/我家自动化/article/detail/505562
推荐阅读
相关标签
  

闽ICP备14008679号