赞
踩
1.generate 可简化为: g ge gen
help 简:h
2.变量也可简化:比如country 就用c 表示 (前提是其他变量开头不带c)
3.变量可以使用通配符: c* 代表所有以c为首字母的变量
4.do文件:用来记录命令
log文件:用来记录结果,运行stata前先建log文件 运行结束后输入log close 保存结果并关闭
5.打开Stata内置(自带)数据,用sysuse命令 文件储存路径可省略
如果打开网络上的Stata文件,用webuse命令,例如: webuse http://www.abc.com/sj.dta (如果从Stata官网获取文件,网址可以省略)
6.表格拍自:金玉国《计量经济学原理与Stata应用》
7.use命令
use D:\data,clear
D:\data是你数据文件所在路径,这里的clear是清空已被读入内存中的其他数据文件,初次打开数据,可以不要。
Stata一次只能用一个数据文件,此外,use只能导入dta格式的数据。
8.描述统计
sysuse auto //打开Stata自带的美国汽车销售数据
by foreign:summarize length weight if price <=5000 //根据foreign分组,有条件的对length weight概述统计
table foreign,contents(n rep mean price sd price med mpg) //列表显示各分组有关的描述统计量
tabulate rep78 //显示经验频数、频率和累计频率分布
9.推断统计
sysuse auto
ci price,level(90) //总体均值99%的置信区间
ttest mpg=30 //对原假设“平均mpg为30”进行t检验
anova price foreign //利用方差分析对原假设“国产车和进口车的平均价格没有差异”进行检验
10.画图
直方图 histogram/his
箱型图 graph box/g
核密度图 kdensity
QQ图 qnorm
两个变量的散点图 scatter/sc
多个变量的散点图矩阵 graph matrix/ gr mat
饼图 graph pie/gr
例子:his mpg,bin(20) start(0) kdensity normal //bin代表分组数,start代表横坐标起点
11.生成随机数
(又叫伪随机数,软件给出的随机数是按照一定的规则生成的)
*生成100个产生自χ²(20)的伪随机数
clear //关闭内存中已打开的文件
set obs 100 //设定随即个数(样本容量)为100
set seed 12345 //设定种子,可省略 (这里看不懂)
gen x=rchi2(20) //生成服从卡方20的变量x的随机数
12.cd命令
cd命令是用来更改储存路径的,一般默认路径是安装Stata的路径,更改需要:cd D:\data ;之后工作的路径就是D:\data了
13.ssc install xx(软件包名字)
有些程序包不是stata自带的,需要这个命令安装才可以用
例如:
ssc install cntrade,replace
cntrade 300750
这样就可以导入300750这个股票过去到现在的所有开盘数据
14.使用do文件的注意事项
使用do文件的时候,用的数据得存放在Stata安装的路径下,如果你另外建了一个文件储存数据,do文件是不能读取运行的。
(不过do文件可以另外建一个文件夹保存)
具体储存数据的地方如下图所示,我们安装Stata的时候会有一个文件夹,文件夹里面会有“ado”名称的文件夹,我们就跟着这层,保存数据在这里就行了。(我怕我没说清楚,再重复一边,就是跟着ado文件夹这一层保存,不要点开ado文件夹再去保存)
关于ado文件夹的补充:打开ado文件夹可以看到里面有两个文件夹,一个是base,用来储存存放stata自带的命令;另一个是plus,用来存放自己下载的外部命令。不过不同版本的stata,名称可能不同,我用的是12版的,里面不叫plus,叫updates
15.tsset命令
这个命令是用来把变量设定为时间序列的,Stata默认数据类型为横截面数据,如果进行时间序列分析,记得先把时间变量设定为时间序列
具体操作:
tsset time //time为你时间变量的名称
16.list的用法
list用来列示出内存的数据
用法:
list x y
按从小到大分区后列出x和y
list x y in 1/10
列出前十分之一的x和y
list x y if x<100
在x大于100的情况下列出x和y
17.tabulate/tab 命令
具体用法:tab x
把x列的数据从小到大列出来,并且计算出频数
如果是想计算出每个区间的频数,可以这样:
recode x 100/200=1 200/300=2 300/400=3
tab x
*这样就把x列的数据按区间(100,200] (200,300] (300,400]分类的频数计算出来了
*不过这个方法会把原来的数据改变。
*不想改变的话就这样写:
recode x 100/200=1 200/300=2 300/400=3,generate(A)
tab A
*A是新创建的变量名称,可自己取名
18.graph combine的用法
这个命令可以把在stata中画出来的图拼在一起,具体用法如下:
tsline var1,name(graph1)
tsline var2,name(graph2)
graph combine graph1 graph2
19.nolog
这个一半是放在估计模型命令的最后,表示不列出计算过程直接得出最后表格,有些数据太庞大,如果stata把计算过程列出来的话,会占用很大的页面。
20.tsappend,add(20)
在数据表最后加多二十行空白格,在线空白格可以用来放预测的数据。
21.quietly
用在估计命令开头,表示不显示结果也不显示计算过程
22.arch var,arch(1/5)nolog
进行arch(1,5)模型估计并且只显示结果
arch var,arch(1/5)garch(1/5)nolog 同理,garch(5,5)模型
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。