当前位置:   article > 正文

5个你或许不知道的pandas数据导入技巧_pandas导入本地文件

pandas导入本地文件

如果您以前曾在 Python 中使用过 Pandas,您就会知道可以通过多种不同的方式导入表格数据。

Pandas 可能是使用最广泛的用于加载、操作和导出数据的 Python 包之一。

虽然您可能熟悉使用 pandas 读取和写入数据的许多不同方法,但您可能没有意识到一些可能并不像您想象的那么明显的快捷方式/技巧。这可以使导入数据变得更加容易和快速。这篇博文仅探讨了其中的五种技术.

1. 从url导入csv

您可能非常熟悉 pd.read_csv() 方法可以导入csv文件的, 其实ta还可以通过 HTTP 从 URL 读取数据。

网络访问 CSV 文件,而不是在本地存储所有文件, 可以省去手动下载内容的麻烦。

  1. import pandas as pd
  2. url = 'csv文件的网络连接'
  3. df = pd.read_csv(url)

2. 导入html网页中的表格

如果您曾经阅读过 pandas 文档,您可能会遇到 pd.read_html() 方法。与 pd.read_csv() 非常相似,它也具有从 URL 导出数据的附加功能。让这更酷的是,您可以提供一个包含许多表格的网站的 URL,它会抓取所有表格。

例如,考虑维基百科文章“英国经济”。这篇文章可以被抓取如下。

  1. url = 'https://en.wikipedia.org/wiki/Economy_of_the_United_Kingdom'
  2. df_tables = pd.read_html(url)

3. JSON规范化

有时,当您处理 JSON 数据时, JSON 内往往包含多层嵌套。对于要转换为表格数据的 JSON 对象,它们需

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/从前慢现在也慢/article/detail/937873
推荐阅读
相关标签
  

闽ICP备14008679号