赞
踩
分位数回归(Quantile Regression)和分组回归(Grouped Regression)是统计学和计量经济学中用于研究变量之间关系的两种不同方法。虽然它们都可以用于探索和解释数据集中的变异性,但它们的应用背景、目的和方法学上有本质的区别。
分位数回归是一种回归分析方法,它允许研究者估计自变量对因变量不同分位数(如中位数、四分位数等)的影响。与传统的最小二乘回归(OLS)不同,它不仅仅关注平均效应,而是提供了一种更全面的视角,通过分析因变量的整个分布来理解自变量的影响。
分位数回归旨在估计条件分位数函数,尤其是因变量
Y
Y
Y 的第
τ
\tau
τ
分位数对自变量
X
X
X的依赖关系。对于给定的分位数
τ
(
0
<
τ
<
1
)
\tau(0<\tau<1)
τ(0<τ<1),分位数回归模型可以表达为:
Q
Y
(
τ
∣
X
)
=
X
β
(
τ
)
Q_Y(\tau|X)=X\beta(\tau)
QY(τ∣X)=Xβ(τ)
其中,
目标函数:分位数回归通过最小化残差的加权和来估计系数,其中权重取决于选择的分位数
τ
\tau
τ。
m
i
n
β
τ
Σ
i
=
1
n
ρ
τ
(
y
i
−
X
i
β
(
τ
)
)
min\beta_{\tau}\Sigma^{n}_{i=1}\rho_{\tau}(y_i-X_i\beta(\tau))
minβτΣi=1nρτ(yi−Xiβ(τ))
其中,
ρ
τ
(
u
)
=
u
(
τ
−
I
(
u
<
0
)
)
,
I
\rho_{\tau}(u)=u(\tau-I(u<0)),I
ρτ(u)=u(τ−I(u<0)),I是示性函数。
求解:通过数值方法(如线性规划)求解上述优化问题,得到对应分位数的系数估计
β
(
τ
)
\beta(\tau)
β(τ)。
分组回归是将总体样本根据一定的标准(如地区、时间、性别等)划分为几个组,然后对每个组分别进行回归分析的一种方法。这种方法能够帮助研究者探究不同组别之间是否存在显著的回归系数差异,从而评估变量间关系的异质性。
分组回归分析涉及将样本根据某一或多个分类变量划分为不同组,然后对每个组独立地进行回归分析。假设有
G
G
G个组,对于第
g
g
g组的回归模型可以表达为:
Y
g
=
X
g
β
g
+
ϵ
g
Y_g=X_g\beta_g+\epsilon_g
Yg=Xgβg+ϵg
其中,
样本划分:根据研究设计的需要,将总体样本划分为若干个组。
独立回归分析:对每个组独立地进行标准的回归分析,估计各自的回归参数 β g \beta_g βg
比较分析:比较不同组之间的回归系数,分析自变量对因变量影响的异质性。
研究焦点:分位数回归关注于自变量对因变量分布不同位置(分位数)的影响,强调在整个因变量分布上的异质性效应;而分组回归关注于不同组别或条件下的回归系数差异,研究的是群体间的异质性。
数据划分依据:分位数回归是基于因变量的分布进行分析,不需要事先对样本进行分组;分组回归则是根据某些特征(如性别、年龄段、地区等)将样本分成不同的组,然后对每组数据进行独立分析。
方法学侧重点:分位数回归提供了一种非参数估计方法,适用于因变量分布不对称或含有异常值的情况;分组回归更多关注参数估计,通过比较不同组的回归参数来探究异质性。
经常我们在计量经济学中,喜欢把y或者x按照分位数分别进行回归,然后把这个叫做分位数回归
。
实际上,这种方式其实是分组回归的策略,内涵不是分位数回归本身,一定要注意严谨。
本质上属于在不同的因变量水平(即分组)上分别探究自变量和因变量之间的线性关系,因此更接近于分组回归的思路。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。