赞
踩
根据面板,其中
和
分别为被解释变量和解释变量(含控制变量),
、
和
分别为个体
维度的影响(被称为个体
维度的固定效应)、时间
维度的影响(被称为时间维度的固定效应)和其他未考虑进去的影响因素(放在
中)。
简单来说,固定效应就是需要考虑的维度中,每个维度单独对被解释变量的影响,即固定效应在一定程度也可以看作控制变量,与常规控制变量不同的是,它假设控制后数据在该维度上各类不可观测的影响因素。例如,企业层面固定效应意味着数据中的所有企业都在同一水平上,不考虑其规模等的差距。
stata中固定效应通常是两个维度的,常用的stata步骤及代码如下。
首先固定效应的id在数据表中以字符串形式储存,但是回归要求处理为数据,因此需要用一下代码进行转化:
- encode id, gen(id_1)
- drop id
- rename id_1 id
处理后,在stata数据表中可以看到province显示为蓝色。
- xtset id year,yearly /*数据设置为面板数据*/
- xtreg 因变量 自变量, fe /*固定效应回归*/
上述固定效应仅针对两个维度,如果想要研究多维的影响(如:国家、行业、企业、时间四个维度),则需要用到多维固定效应。
通常来说,以上固定效应stata命令也可以实现多维的效果,但是速度较慢,因此特别引入新的命令——reghdfe
ssc install reghdfe, replace
reghdfe depvar [indepvars] [if] [in] [weight], absorb(absvars) [options]
depvar:被解释变量
indepvars:解释变量和控制变量
absorb(absvar):固定效应(如果要保留固定效应结果使用)
options中特别注意vce([cluster] var),该内容是针对标准误进行的,主要考虑影响t值检验的情况。
3. 稳健标准误
目前,我所见到的主要包括两类stata处理——异方差稳健标准误和聚类稳健标准误。
普通标准误是基于高斯马尔科夫定理,即 是满足同方差相互独立假设的。使用的stata命令为
reg y x
异方差稳健标准误,也称作稳健标准误,是指数据满足相互独立但异方差的情况,这类数据通常为截面数据。使用的stata命令为
- reg y x, r
- /* 或者 */
- reg y x, vce(robust)
聚类稳健标准误则是针对时间序列数据或者面板数据这类存在异方差且存在自相关的数据。使用的stata命令为
reg y x,vce(cluster id)
通常聚类到高层次上面,即id是更加高层次的数据,相对于行业来说国家属于高层次,相对于企业来说行业属于高层次。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。