当前位置:   article > 正文

STATA基础笔记_tsset命令

tsset命令

1.generate 可简化为: g ge gen
help 简:h

2.变量也可简化:比如country 就用c 表示 (前提是其他变量开头不带c)

3.变量可以使用通配符: c* 代表所有以c为首字母的变量

4.do文件:用来记录命令
log文件:用来记录结果,运行stata前先建log文件 运行结束后输入log close 保存结果并关闭

5.打开Stata内置(自带)数据,用sysuse命令 文件储存路径可省略
如果打开网络上的Stata文件,用webuse命令,例如: webuse http://www.abc.com/sj.dta (如果从Stata官网获取文件,网址可以省略)

6.表格拍自:金玉国《计量经济学原理与Stata应用》请添加图片描述
请添加图片描述
请添加图片描述
7.use命令
use D:\data,clear
D:\data是你数据文件所在路径,这里的clear是清空已被读入内存中的其他数据文件,初次打开数据,可以不要。
Stata一次只能用一个数据文件,此外,use只能导入dta格式的数据。

8.描述统计

sysuse auto //打开Stata自带的美国汽车销售数据
by foreign:summarize length weight if price <=5000 //根据foreign分组,有条件的对length weight概述统计
table foreign,contents(n rep mean price sd price med mpg) //列表显示各分组有关的描述统计量
tabulate rep78 //显示经验频数、频率和累计频率分布

  • 1
  • 2
  • 3
  • 4
  • 5

9.推断统计

sysuse auto
ci price,level(90) //总体均值99%的置信区间
ttest mpg=30 //对原假设“平均mpg为30”进行t检验
anova price foreign //利用方差分析对原假设“国产车和进口车的平均价格没有差异”进行检验
  • 1
  • 2
  • 3
  • 4

10.画图
直方图 histogram/his
箱型图 graph box/g
核密度图 kdensity
QQ图 qnorm
两个变量的散点图 scatter/sc
多个变量的散点图矩阵 graph matrix/ gr mat
饼图 graph pie/gr

例子:his mpg,bin(20) start(0) kdensity normal //bin代表分组数,start代表横坐标起点

11.生成随机数
(又叫伪随机数,软件给出的随机数是按照一定的规则生成的)

*生成100个产生自χ²(20)的伪随机数
clear //关闭内存中已打开的文件
set obs 100 //设定随即个数(样本容量)为100
set seed 12345 //设定种子,可省略 (这里看不懂)
gen x=rchi2(20) //生成服从卡方20的变量x的随机数
  • 1
  • 2
  • 3
  • 4
  • 5

12.cd命令
cd命令是用来更改储存路径的,一般默认路径是安装Stata的路径,更改需要:cd D:\data ;之后工作的路径就是D:\data了

13.ssc install xx(软件包名字)
有些程序包不是stata自带的,需要这个命令安装才可以用
例如:
ssc install cntrade,replace
cntrade 300750
这样就可以导入300750这个股票过去到现在的所有开盘数据
14.使用do文件的注意事项
使用do文件的时候,用的数据得存放在Stata安装的路径下,如果你另外建了一个文件储存数据,do文件是不能读取运行的。
(不过do文件可以另外建一个文件夹保存)
具体储存数据的地方如下图所示,我们安装Stata的时候会有一个文件夹,文件夹里面会有“ado”名称的文件夹,我们就跟着这层,保存数据在这里就行了。(我怕我没说清楚,再重复一边,就是跟着ado文件夹这一层保存,不要点开ado文件夹再去保存)
在这里插入图片描述
关于ado文件夹的补充:打开ado文件夹可以看到里面有两个文件夹,一个是base,用来储存存放stata自带的命令;另一个是plus,用来存放自己下载的外部命令。不过不同版本的stata,名称可能不同,我用的是12版的,里面不叫plus,叫updates

15.tsset命令
这个命令是用来把变量设定为时间序列的,Stata默认数据类型为横截面数据,如果进行时间序列分析,记得先把时间变量设定为时间序列
具体操作:
tsset time //time为你时间变量的名称

16.list的用法
list用来列示出内存的数据
用法:
list x y
按从小到大分区后列出x和y
list x y in 1/10
列出前十分之一的x和y
list x y if x<100
在x大于100的情况下列出x和y

17.tabulate/tab 命令
具体用法:tab x
把x列的数据从小到大列出来,并且计算出频数
如果是想计算出每个区间的频数,可以这样:

recode x 100/200=1 200/300=2 300/400=3
tab x
*这样就把x列的数据按区间(100,200]200300] (300,400]分类的频数计算出来了
*不过这个方法会把原来的数据改变。
*不想改变的话就这样写:
recode x 100/200=1 200/300=2 300/400=3,generate(A)
tab A
*A是新创建的变量名称,可自己取名
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8

18.graph combine的用法
这个命令可以把在stata中画出来的图拼在一起,具体用法如下:

tsline var1,name(graph1)
tsline var2,name(graph2)
graph combine graph1 graph2
  • 1
  • 2
  • 3

19.nolog
这个一半是放在估计模型命令的最后,表示不列出计算过程直接得出最后表格,有些数据太庞大,如果stata把计算过程列出来的话,会占用很大的页面。

20.tsappend,add(20)
在数据表最后加多二十行空白格,在线空白格可以用来放预测的数据。
在这里插入图片描述
21.quietly
用在估计命令开头,表示不显示结果也不显示计算过程

22.arch var,arch(1/5)nolog
进行arch(1,5)模型估计并且只显示结果
arch var,arch(1/5)garch(1/5)nolog 同理,garch(5,5)模型

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/羊村懒王/article/detail/534614
推荐阅读
相关标签
  

闽ICP备14008679号