赞
踩
【目前先文字说明,以后补代码示例】
时间序列分析在金融数据分析中占据重要位置,Pandas包中也支持时间序列类型的数据。时间序列(time series)类型也是一种Series类型,与一般Series对象不同的是,时间序列index属性取值为时间戳(在python中,时间戳就是Timestamp对象或DatetimeIndex对象)。
Timestamp对象由pandas包中的Timestamp()来创建,其传入值可以为str类型数据,也可以为datetime类型数据。(详细语法自行查阅手册、help()或者工具书网站)需要指出的是,Timestamp()方法更多只有理论意义。在实际应用中,Seires对象的Index属性可以直接接收多个datetime对象(以列表形式存放),但是本质上是先将它们自动转化成T对象(你们一定看得懂)再接收。所以我怀疑按这个事实,那么Index是否可以直接接收成员为str的列表?有时间可以试一试。
更常用的是pandas.to_datetime(),因为其可接受列表等可迭代对象,但Timestamp()一次只能传入一个对象。注意,这个方法得到的类型为DatetimeIndex对象,在这里我们把这个对象用作Series对象的Index属性。
以上都是为了构造一个时间序列型Series对象。时间序列之间的算术运算会自动按时间对齐。
如何提取元素及切片不详细说明,可查阅相关方法。本质上是遵循Series索引方法的。
滞后/超前操作:是Series对象的shift()方法,用它可计算简单的收益率。
差分:是Series对象的diff()方法,待考
Dataframe对象:表格型的数据结构。是共享同一个Index的Series的集合。创建一个Dataframe对象必须先建立其Index。
参考文献:蔡立耑《量化投资以python为工具》
刘宗汉《Python数据处理》(未出版)
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。