赞
踩
在前两讲中,我们介绍了多元线性回归的概念以及多元线性回归中的交互作用。今天学习的主要内容是多元线性回归中的多重共线性和方差膨胀因子。
1. 共线性的概念1
共线性
在多元回归中,两个或多个预测变量可能彼此相关,这种情况称为共线性(multicollinearity)。2
多重共线性
存在一种称为多重共线性的极端情况,其中三个或更多变量之间存在共线性,即使没有一对变量具有特别高的相关性。这意味着预测变量之间存在冗余。
重点:在存在多重共线性的情况下,回归模型的解变得不稳定 2. 共线性的评估对于给定的预测变量(p),可以通过计算一个称为方差膨胀因子(variance inflation factor,VIF)的分数来评估多重共线性,该分数测量由于模型中的多重共线性而使回归系数的方差膨胀了多少。
VIF的最小可能值为1(不存在多重共线性)。根据经验,VIF值超过5或10表示有共线性问题。
面对多重共线性时,应删除相关的变量,因为多重共线性的存在意味着在存在其他变量的情况下该变量提供的有关响应的信息是多余的 。
3. 多重共线性检验的R实现library(tidyverse)library(caret)
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。