当前位置:   article > 正文

R语言Stan贝叶斯回归置信区间后验分布可视化模型检验|附数据代码

R语言Stan贝叶斯回归置信区间后验分布可视化模型检验|附数据代码

全文链接:https://tecdat.cn/?p=35899

贝叶斯回归是一种统计方法,它使用贝叶斯定理来估计回归模型的参数。与传统的频率派回归方法不同,贝叶斯回归提供了参数的后验分布,而不仅仅是点估计。这意味着我们可以得到参数的不确定性度量,而不仅仅是单一的估计值点击文末“阅读原文”获取完整代码数据)。

相关视频

R语言用于拟合贝叶斯广义线性模型。我们可以方便地帮助客户拟合贝叶斯线性回归、逻辑回归、多项式回归等各种模型。

Stan

你可以运行大多数回归。

  • 由于广义线性模型(GLMs)涵盖了线性回归、probit、logit、Poisson、二项式、指数等模型,

glm

Family(可能还需要一个link参数)定义了你想要的回归类型:

  • 线性回归:family = gaussian

  • Logit:family = binomial(link = "logit")

  • Probit:family = binomial(link = "probit")

  • Poisson:family = poisson

先验分布:

  • 无信息先验可以通过使用prior = NULL来设置

  • 弱信息先验可以通过使用prior =与以下之一来指定:

    • normal, student_t, cauchy, laplace以及更多,可以在这里找到

使用rstanarm的泰坦尼克号生存示例

384f1b63c722966fbf0b02a87ff8c479.png

  1. # 重构Class列
  2. Titanic$class <- str_extract(Titanic$PClass, "[0-9]")
  3. # 显示模型摘要
  4. summary(TitanicLinear)

在实践中,对于二元目标变量,通常会选择逻辑回归(例如,使用family = binomial(link = "logit"))。模型的摘要会提供有关模型拟合的详细信息,包括每个预测变量的系数和它们的置信区间。

40dffd0ae0cdbaa1e63f6c90bc3a70b1.png

81379d91cefb8892aef46712c81f1aa7.png

可信区间

打印置信区间。

bb15491929cc3529c2913dab16a4e6e2.png

图形化可信区间

671abd51b69702d7350b9d9ff8c387c5.png


点击标题查阅往期内容

ed1361f0dfbfbde64a05d72d45d9316b.jpeg

数据分享|R语言逻辑回归、Naive Bayes贝叶斯、决策树、随机森林算法预测心脏病

outside_default.png

左右滑动查看更多

outside_default.png

01

107a32cee918b7c73fdb00bd7ede9169.png

02

106134bab4f04223dd57b5204b9d7f12.png

03

aabb707d73783767fe3e772aa41fd337.png

04

6672f38709e047a1157f6e5e863390a8.png

绘制后验分布

在R中,你还可以轻松地绘制参数的后验分布。后验分布反映了在给定数据后,你对模型参数的信念。你可以使用各种可视化技术来展示这些分布,如直方图、密度图或箱线图。

  1. ggplot(Titanic_poste
  2. ss)) +
  3. geom_histogram()

9d78d50a9ef66a1ed64c62ab7820863e.png

先验和后验的比较

07675ad56a316841a73e7612ab9cf287.png

模型检验

模型检验基础

执行贝叶斯回归后,有多种回归诊断方法可以帮助推断模型是否收敛、表现如何,甚至比较不同模型。

图形化后验预测分析

要检查后验分布的预测准确性,它会将后验分布模拟的y值与实际的y值进行比较并绘制图形。

8be5be55dec312b45eb970fbfa03e62e.png

正则化与预测准确性

在贝叶斯和频率派估计中,一个关键问题是如何平衡预测准确性与简约性。换句话说,研究人员应该关注如何在不过度拟合数据的同时创建具有说服力的模型。

WAIC 示例

788fa8308d5282cca4a4dd543f41202e.png

留一交叉验证

除了WAIC之外,另一种比较样本外预测能力的方法是应用留一交叉验证(LOO)。

  • LOO通过迭代地将数据划分为训练集和预测集来评估后验模拟的预测能力。

LOO 示例

41a08c0d5e29b01d6494abd250ed3130.png

模型比较

  1. 复制代码
  2. Titanic_probit <-
  3. data = Titanic, family = binomial(link=probit))
  4. Loo_probit <- loo(Titanic_probit)
  5. data = Titanic, family = binomial(link=logit))
  6. Loo_logit <- loo(Titanic_logit)
  7. # ELPD_diff>0 表示第二个模型更受支持

在上面的代码中,我们拟合两个贝叶斯广义线性模型,分别使用了probit和logit链接函数。

0d82b0b6d9ad38fe729dc98005dfcc2a.png


f454aa1dd95832487292b18749d9db8a.jpeg

点击文末“阅读原文”

获取全文完整代码数据资料。

本文选自《R语言Stan贝叶斯回归置信区间后验分布可视化模型检验|》。

ea915d29e9dc2a895503c2a85609511b.jpeg

8bb429766831ec327764ee3916edf565.png

点击标题查阅往期内容

R语言逻辑回归logistic模型分析泰坦尼克titanic数据集预测生还情况

R语言是否对二分连续变量执行逻辑回归

R语言用lme4多层次(混合效应)广义线性模型(GLM),逻辑回归分析教育留级调查数据

R语言随机森林RandomForest、逻辑回归Logisitc预测心脏病数据和可视化分析

R语言基于Bagging分类的逻辑回归(Logistic Regression)、决策树、森林分析心脏病患者

R语言逻辑回归(Logistic回归)模型分类预测病人冠心病风险

R语言用局部加权回归(Lowess)对logistic逻辑回归诊断和残差分析

R语言用主成分PCA、 逻辑回归、决策树、随机森林分析心脏病数据并高维可视化

R语言用线性模型进行臭氧预测:加权泊松回归,普通最小二乘,加权负二项式模型,多重插补缺失值

R语言Bootstrap的岭回归和自适应LASSO回归可视化

R语言中回归和分类模型选择的性能指标

R语言多元时间序列滚动预测:ARIMA、回归、ARIMAX模型分析

R语言用lme4多层次(混合效应)广义线性模型(GLM),逻辑回归分析教育留级调查数据

R语言计量经济学:虚拟变量(哑变量)在线性回归模型中的应用

R语言 线性混合效应模型实战案例

R语言混合效应逻辑回归(mixed effects logistic)模型分析肺癌数据

R语言如何用潜类别混合效应模型(LCMM)分析抑郁症状

R语言基于copula的贝叶斯分层混合模型的诊断准确性研究

R语言建立和可视化混合效应模型mixed effect model

R语言LME4混合效应模型研究教师的受欢迎程度

R语言 线性混合效应模型实战案例

R语言用Rshiny探索lme4广义线性混合模型(GLMM)和线性混合模型(LMM)

R语言基于copula的贝叶斯分层混合模型的诊断准确性研究

R语言如何解决线性混合模型中畸形拟合(Singular fit)的问题

基于R语言的lmer混合线性回归模型

R语言用WinBUGS 软件对学术能力测验建立层次(分层)贝叶斯模型

R语言分层线性模型案例

R语言用WinBUGS 软件对学术能力测验(SAT)建立分层模型

使用SAS,Stata,HLM,R,SPSS和Mplus的分层线性模型HLM

R语言用WinBUGS 软件对学术能力测验建立层次(分层)贝叶斯模型

SPSS中的多层(等级)线性模型Multilevel linear models研究整容手术数据

用SPSS估计HLM多层(层次)线性模型模型

e549613058d50624bcca5804e82bfe32.png

57b58c923b44314402f0d613ba989afd.jpeg

96473beed95392719f36ba225ad9fd55.png

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/不正经/article/detail/505566
推荐阅读
相关标签
  

闽ICP备14008679号