赞
踩
这里推荐闲鱼购买安装包,一块钱以内可以解决的事我们不要浪费太多时间,安装教程很简单,不需要配环境一路点安装即可。本篇使用的是Stata18。
这三个版本的差别在于功能性,具体解释:
1.stata IC
这个版本在官方的解释是"标准版"的意思,这版本支持2048个变量,给我们日常的使用已经足够了。
2.stata SE
这个版本的官方解释是"特别版"special edition的意思。但在国内几乎75%的stata用户都在用这个版本。这个版本相比于IC,优势就是变量最大支持32767个变量。
3.stata MP
这个版本的官方解释是加入"并行计算"能力。官网的价格也贵得发指,MP支持最大120000个变量和超过20亿个观测值,同时,在运算过程中支持多核cpu,能够加快运算速度。显然这个版本应该是最优秀的。
我们以Excel格式为例,点击-文件-导入-EXL
注意勾选是否将第一行作为变量名
在Stata中,xtset函数用于设置数据集中的面板数据,它将数据集中的变量标识为面板标识变量和时间标识变量,以便Stata能够正确地进行面板数据分析。
假设我们有一个数据集包含个人的收入和年份信息,个人编号为id,年份为year。我们可以使用xtset函数将数据集设置为面板数据:
xtset id year
报错提示:r(451)
repeated time values within panel
数据中有重复项,且内容不一致
解决方法:
duplicates drop code year,force
首先我们可能需要下载外部命令
(如遇下载问题请检查版本)
ssc install outreg2
ssc install logout
对所有变量做描述性统计
outreg2 using xxx.doc,replace sum(log) title(Decriptive statistics)
其中,xxx.doc为结果导入到的文件,自己命名也可。
对个别变量做描述性统计
outreg2 using xxx.doc,replace sum(log) keep(XXX)title(Decriptive statistics)
这个Keep里的XXX也就是需要对哪些变量做描述性统计,可以在keep的括号内,去右上变量窗口选取:
特质依据描述性统计
bysort XXX :outreg2 using xxx.doc,replace sum(log) title(Decriptive statistics)
同样,这里的XXX也是我们选取需要依据的变量。
相关性检验
correlate y x1 x2 x3
pwcorr y x1 x2 x3
多元回归分析
regress Y X1 X2 X3
对于分析结果,我们有:
Coefficients(系数):这一部分显示了每个自变量的系数估计值。这些值表示自变量对因变量的影响程度。系数的正负号表示方向,而数值大小表示影响的强度。
Std. Err(标准误差):这是系数的标准误差,用于计算系数的置信区间。置信区间可以帮助确定系数估计的可靠性。
t统计量(t-value):它是系数估计值与零之间的差异,除以标准误差。通常,如果t统计量的绝对值越大,说明系数越显著。
P值:P值用于测试自变量是否对因变量有显著影响。通常,P值小于0.05(通常的显著性水平)时,认为自变量具有显著影响。
R-squared(R平方):R平方衡量模型的拟合程度,范围从0到1,表示模型能够解释因变量变异的百分比。更高的R平方值表示模型更好地拟合数据。
F统计量(F-value):用于测试整个模型的显著性。较大的F统计量和较小的P值表示模型整体上是显著的。
输入estat vif
我们可以进行共线性分析,来判断模型的合理性
怀特检验
estat imtest,white
//其中"estat"指的是"post-estimation statistics"(估计后统计量)
//"imtest"指的是"information matrix test"
统计图示我们可以用代码或者用菜单-图形-选取。
示例:
twoway line ProfitY year if code==1
twoway plot [if] [in] [, twoway_options]
twoway的命令是twoway plot 变量 [if] [in] [, twoway_options],我们可以自己定义的主要是:
plot:选择图像的种类,这里的plot可以改成scatter, plot, connected, area, bar等,我们可以绘制出相应的图。
变量:这里可以写一个或多个y变量,一个x变量。最后一个是x变量,之前的为y变量。
[if] [in] [, twoway_options]等中括号内的命令是可选命令,如果不写,则表示默认值。
if:定义所取某一个自变量的范围,例如if le > 40,即只画le>40的图
in:定义所取观测值的范围,例如in 10/20,即只画第10到20个观测值的图
twoway_options:可以定义图像的“美观”部分,例如坐标轴范围、标题、注释、标签等等。
效果示例:
这里例举了一些最基础的操作,其他的操作也与此同理。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。