赞
踩
这是一个包涵许多pandas教程的指南,主要面向新用户。
#####内部指南
看10分钟入门pandas*(10 Minutes to pandas)
更复杂的使用方法参看cookbook
#####pandas cookbook
这本cookbook的目标是给你一些具体的例子,让你从pandas开始。这些都是真实数据的例子,以及它所包含的所有错误和古怪。
这里是v0.1版本的链接。对于最新的目录,请参阅pandas-cookbook GitHub存储库。要运行本教程中的示例,您需要克隆GitHub存储库并运行IPython Notebook。看看如何使用这本cookbook。
(先去github下载数据,否则下面的章节没办法完成)
######快速的浏览一下IPython Notebook
教你一些IPython的简单用法
######chapter 1. 把你的数据由pandas读取听起来是最简单的事情。即使编码是错误的
从csv文件中读取一个数据
您可以使用read_csv函数从CSV文件中读取数据。默认情况下,它假定字段是逗号分隔的。
我们将从蒙特利尔看一些骑自行车的数据。这里是原始页面(在法语中),但它已经包含在这个存储库中。我们使用的是2012年的数据。
import pandas as pd
pd.set_option('display.mpl_style', 'default') # Make the graphs a bit prettier
figsize(15, 5)
个人执行:运行display.mpl_style出错
broken_df = pd.read_csv('../data/bikes.csv')
# Look at the first 3 rows
broken_df[:3]
(因为自己的ipython工作路径,和下载的bikes.csv路径不一致,写代码的时候要注意)
个人执行:直接报错,看不了什么前3行
你可以看到这完全损坏了。read_csv拥有一堆选项能够让我们修复它,在这里我们:
将列分隔符改成;
将编码改为latin1(默认为utf-8)
解析Date列中的日期
告诉它我们的日期将日放在前面,而不是月
将索引设置为Date
fixed_df = pd.read_csv('../data/bikes.csv', sep=';'
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。