当前位置:   article > 正文

R语言开发之泊松回归了解下_r语言拟合泊松分布后怎么根据输出结果写因变量函数

r语言拟合泊松分布后怎么根据输出结果写因变量函数

泊松回归涉及回归模型,其响应变量是计数形式而不是分数数字。举个栗子,计算出生人数或一个足球比赛系列中的胜率数,响应变量的值也遵循泊松分布,一般情况下它的数学方程式如下:

log(y) = a + b1x1 + b2x2 + bnxn.....

参数描述如下:

  • y - 是响应变量。
  • ab 是数字系数。
  • x - 是预测变量。

在R中,用于创建泊松回归模型的函数是glm()函数,语法如下:

glm(formula,data,family)

参数描述如下:

  • formula - 是呈现变量之间关系的符号。
  • data - 是给出这些变量值的数据集。
  • family -是R对象来指定模型的细节,逻辑回归的值是“泊松”。

我们接下来使用内置数据集“warpbreaks”,它描述了羊毛类型(AB)和张力(低,中或高)对每个织机的翘曲数的影响。我们就将“breaks”视为响应变量,这是一个休息次数的计数,之后就把羊毛“type”“tension”作为预测变量,先来看下需要输入的数据集,如下:

  1. input <- warpbreaks
  2. print(head(input))

输出结果如下:

  1. breaks wool tension
  2. 1 26 A L
  3. 2 30 A L
  4. 3 54 A L
  5. 4 25 A L
  6. 5 70 A L
  7. 6 52 A L

接下来,我们就要尝试创建一个回归模型,如下:

  1. output <-glm(formula = breaks ~ wool+tension,
  2. data = warpbreaks,
  3. family = poisson)
  4. print(summary(output))

输出结果如下:

  1. Call:
  2. glm(formula = breaks ~ wool + tension, family = poisson, data = warpbreaks)
  3. Deviance Residuals:
  4. Min 1Q Median 3Q Max
  5. -3.6871 -1.6503 -0.4269 1.1902 4.2616
  6. Coefficients:
  7. Estimate Std. Error z value Pr(>|z|)
  8. (Intercept) 3.69196 0.04541 81.302 < 2e-16 ***
  9. woolB -0.20599 0.05157 -3.994 6.49e-05 ***
  10. tensionM -0.32132 0.06027 -5.332 9.73e-08 ***
  11. tensionH -0.51849 0.06396 -8.107 5.21e-16 ***
  12. ---
  13. Signif. codes: 0***0.001**0.01*0.05 ‘.’ 0.1 ‘ ’ 1
  14. (Dispersion parameter for poisson family taken to be 1)
  15. Null deviance: 297.37 on 53 degrees of freedom
  16. Residual deviance: 210.39 on 50 degrees of freedom
  17. AIC: 493.06
  18. Number of Fisher Scoring iterations: 4

在上面结果中,我们在最后一列中寻找小于0.05p值来考虑预测变量对响应变量的影响。

可以看到的是,具有M型和H型张力的羊毛型B对休息次数有影响。

好啦,本次记录就到这里了。

如果感觉不错的话,请多多点赞支持哦。。。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/weixin_40725706/article/detail/910642
推荐阅读
相关标签
  

闽ICP备14008679号