当前位置:   article > 正文

【Stata】实证分析笔记_stata 18 mp

stata 18 mp

如何运用stata完成简单的实证分析

安装

这里推荐闲鱼购买安装包,一块钱以内可以解决的事我们不要浪费太多时间,安装教程很简单,不需要配环境一路点安装即可。本篇使用的是Stata18。
在这里插入图片描述
这三个版本的差别在于功能性,具体解释:
1.stata IC
这个版本在官方的解释是"标准版"的意思,这版本支持2048个变量,给我们日常的使用已经足够了。
2.stata SE
这个版本的官方解释是"特别版"special edition的意思。但在国内几乎75%的stata用户都在用这个版本。这个版本相比于IC,优势就是变量最大支持32767个变量。
3.stata MP
这个版本的官方解释是加入"并行计算"能力。官网的价格也贵得发指,MP支持最大120000个变量和超过20亿个观测值,同时,在运算过程中支持多核cpu,能够加快运算速度。显然这个版本应该是最优秀的。
在这里插入图片描述

图表导入

我们以Excel格式为例,点击-文件-导入-EXL
在这里插入图片描述
注意勾选是否将第一行作为变量名
在这里插入图片描述

数据面板生成

在Stata中,xtset函数用于设置数据集中的面板数据,它将数据集中的变量标识为面板标识变量和时间标识变量,以便Stata能够正确地进行面板数据分析。

  • panel_varname:表示面板标识变量的名称。它通常是一个表示个体或单位的变量,比如个人、国家或公司的编号。
  • time_varname:表示时间标识变量的名称。它通常是一个表示时间的变量,比如年份或月份。

假设我们有一个数据集包含个人的收入和年份信息,个人编号为id,年份为year。我们可以使用xtset函数将数据集设置为面板数据:

 xtset id year
  • 1

报错提示:r(451)
repeated time values within panel
数据中有重复项,且内容不一致
解决方法:

 duplicates drop code year,force
  • 1

统计生成

首先我们可能需要下载外部命令
(如遇下载问题请检查版本)

ssc install outreg2
ssc install logout

  • 1
  • 2
  • 3

对所有变量做描述性统计

outreg2 using xxx.doc,replace sum(log) title(Decriptive statistics)
  • 1

其中,xxx.doc为结果导入到的文件,自己命名也可。
在这里插入图片描述
对个别变量做描述性统计

outreg2 using xxx.doc,replace sum(log) keep(XXX)title(Decriptive statistics)
  • 1

这个Keep里的XXX也就是需要对哪些变量做描述性统计,可以在keep的括号内,去右上变量窗口选取:
在这里插入图片描述
特质依据描述性统计

bysort XXX :outreg2 using xxx.doc,replace sum(log) title(Decriptive statistics)
  • 1

同样,这里的XXX也是我们选取需要依据的变量。

相关性检验

correlate y x1 x2 x3
pwcorr y x1 x2 x3
  • 1
  • 2

多元回归分析

regress Y X1 X2 X3
  • 1

对于分析结果,我们有:
Coefficients(系数):这一部分显示了每个自变量的系数估计值。这些值表示自变量对因变量的影响程度。系数的正负号表示方向,而数值大小表示影响的强度。

Std. Err(标准误差):这是系数的标准误差,用于计算系数的置信区间。置信区间可以帮助确定系数估计的可靠性。

t统计量(t-value):它是系数估计值与零之间的差异,除以标准误差。通常,如果t统计量的绝对值越大,说明系数越显著。

P值:P值用于测试自变量是否对因变量有显著影响。通常,P值小于0.05(通常的显著性水平)时,认为自变量具有显著影响。

R-squared(R平方):R平方衡量模型的拟合程度,范围从0到1,表示模型能够解释因变量变异的百分比。更高的R平方值表示模型更好地拟合数据。

F统计量(F-value):用于测试整个模型的显著性。较大的F统计量和较小的P值表示模型整体上是显著的。

输入estat vif
我们可以进行共线性分析,来判断模型的合理性
在这里插入图片描述
怀特检验

estat imtest,white
//其中"estat"指的是"post-estimation statistics"(估计后统计量)
//"imtest"指的是"information matrix test"
  • 1
  • 2
  • 3

在这里插入图片描述

统计图示我们可以用代码或者用菜单-图形-选取。
示例:

twoway line  ProfitY year if code==1
  • 1

twoway plot [if] [in] [, twoway_options]

twoway的命令是twoway plot 变量 [if] [in] [, twoway_options],我们可以自己定义的主要是:
plot:选择图像的种类,这里的plot可以改成scatter, plot, connected, area, bar等,我们可以绘制出相应的图。
变量:这里可以写一个或多个y变量,一个x变量。最后一个是x变量,之前的为y变量。
[if] [in] [, twoway_options]等中括号内的命令是可选命令,如果不写,则表示默认值。
if:定义所取某一个自变量的范围,例如if le > 40,即只画le>40的图
in:定义所取观测值的范围,例如in 10/20,即只画第10到20个观测值的图
twoway_options:可以定义图像的“美观”部分,例如坐标轴范围、标题、注释、标签等等。
效果示例:
在这里插入图片描述

这里例举了一些最基础的操作,其他的操作也与此同理。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/AllinToyou/article/detail/299472
推荐阅读
相关标签
  

闽ICP备14008679号