赞
踩
前面几篇我们介绍了 Pandas 的一些基础操作,有同学在后台给小编留言,纯粹的介绍 API 太无聊了,那么,小编这篇就来点有用的东西,希望大家能在以后的工作生活中都用得上。
本篇主要介绍如何将数据导入 Pandas 进行一些简单的操作。
操作的数据源嘛,就选择小编对自己博客站数据的抓取,这里小编将自己的博客数据导出成了两种格式, Excel 和 CSV ,各位同学在平常的工作生活中能接触的应该也是这两种格式。
导入 Excel 数据主要使用到的方法是 Pandas 中的 read_excel() 。
在进行导入操作的时候,要注意文件路径,这里的文件路径可以使用相对路径也可以使用绝对路径,但是不管哪种路径最基本的是要写对。
小编先使用相对路径做个演示:
import pandas as pd df = pd.read_excel("result_data.xlsx") print(df) # 输出内容 plantform read_num fans_num rank_num like_num create_date 0 cnblog 215 0 118 0 2019-11-23 23:00:10 1 juejin 177 0 -2 1 2019-11-23 23:00:03 2 csdn 1652 69 0 24 2019-11-23 23:00:02 3 cnblog 650 3 191 0 2019-11-22 23:00:15 4 juejin 272 3 -23 1 2019-11-22 23:00:02 .. ... ... ... ... ... ... 403 juejin 212 0 -1 2 2020-02-20 23:00:02 404 csdn 1602 1 0 1 2020-02-20 23:00:01 405 cnblog 19 0 41 0 2020-02-21 23:00:05 406 juejin 125 1 -4 0 2020-02-21 23:00:02 407 csdn 1475 8 0 3 2020-02-21 23:00:02 [408 rows x 6 columns]
因为小编这里的 Excel 就放在代码的同级目录,所以直接写文件名即可,接下来演示绝对路径。
由于小编的操作系统是 Windows 的操作系统,文件路径默认是使用 \ ,如 D:\Development\Projects\python-learning\python-data-analysis\pandas-demo\result_data.xlsx ,我们在直接使用 Windows 的文件路径的时候需要在前面增加一个 r (转义符)避免路径中的 \ 被转义,如下:
import pandas as pd df = pd.read_excel(r"D:\Development\Projects\python-learning\python-data-analysis\pandas-demo\result_data.xlsx") print(df) # 输出内容 plantform read_num fans_num rank_num like_num create_date 0 cnblog 215 0 118 0 2019-11-23 23:00:10 1 juejin 177 0 -2 1 2019-11-23 23:00:03 2 csdn 1652 69 0 24 2019-11-23 23:00:02 3 cnblog 650 3 191 0 2019-11-22 23:00:15 4 juejin 272 3 -23 1 2019-11-22 23:00:02 .. ... ... ... ... ... ... 403 juejin 212 0 -1 2 2020-02-20 23:00:02 404 csdn 1602 1 0 1 2020-02-20 23:00:01 405 cnblog 19 0 41 0 2020-02-21 23:00:05 406 juejin 125 1 -4 0 2020-02-21 23:00:02 407 csdn 1475 8 0 3 2020-02-21 23:00:02 [408 rows x 6 columns]
当然,如果不想使用这个转义符 r 也行,这样需要修改下文件的路径,将所有的 \ 变成 / ,这个规则适用于其他所有的文件路径操作,示例如下:
import pandas as pd
df = pd.read_excel("D:/Development/Projects/python-learning/python-data-analysis/pandas-demo/result_data.xlsx")
print(df)
# 输出内容
plantform read_num fans_num rank_num like_num create_date
0 cnblog 215 0 118 0 2019-11-23 23:00:10
1 juejin 177 0 -2 1 2019-11-23 23:00:03
2 csdn 1652 69 0 24 2019-11-23 23:00:02
3 cnblog 650 3 191 0 2019-11-22 23:00:15
4 juejin 272 3 -23 1 2019-11-22 23:00:02
.. ... ... ... .
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。