当前位置:   article > 正文

Python爬虫数据可视化_python爬虫3000条可视化

python爬虫3000条可视化

Python爬虫——数据可视化

导入需要的第三方库

  1. import matplotlib.pyplot as plt
  2. import seaborn as sns
  3. import pandas as pd
  4. import requests
  5. import urllib3
  6. import matplotlib as mpl

设置可以显示中文和改变字体

  1. mpl.rcParams['font.sans-serif'] = ['KaiTi']
  2. mpl.rcParams['font.serif'] = ['KaiTi']
  3. mpl.rcParams['axes.unicode_minus'] = False
  4. sns.set_style("darkgrid", {"font.sans-serif": ['KaiTi', 'Arial']})

爬取数据:此方法只适用于表格

  1. urllib3.disable_warnings()
  2. url = "http://www.stats.gov.cn/ztjc/zdtjgz/zgrkpc/dqcrkpc/ggl/202105/t20210519_1817699.html"
  3. response = requests.get(url, verify=False)
  4. response.encoding = response.apparent_encoding
  5. html = response.text
  6. data = pd.read_html(html, header=0)[1]
  7. print(data)

提取数据中的某一列

  1. city = list(data["地区"])#提取数据中名为“地区”的一列
  2. year1 = list(data["2020年"])#提取数据中名为“2020年”的一列
  3. year2 = list(data["2010年"])#提取数据中名为“2010年”的一列

将数据可视化为折线图

  1. he = {"2020年": year1, "2010年": year2}#在图中显示数据命名year1命名为“2020年”
  2. #在图中显示数据命名year2命名为“2010年”
  3. df = pd.DataFrame(he, city)#he代表纵坐标,city代表横坐标
  4. df.plot.line()#定义绘制折线图
  5. plt.show()#将折线图展示

完整代码如下

  1. import matplotlib.pyplot as plt
  2. import seaborn as sns
  3. import pandas as pd
  4. import requests
  5. import urllib3
  6. import matplotlib as mpl
  7. #设置可以显示中文和改变字体
  8. mpl.rcParams['font.sans-serif'] = ['KaiTi']
  9. mpl.rcParams['font.serif'] = ['KaiTi']
  10. mpl.rcParams['axes.unicode_minus'] = False
  11. sns.set_style("darkgrid", {"font.sans-serif": ['KaiTi', 'Arial']})
  12. #爬取数据只适用于表格
  13. urllib3.disable_warnings()
  14. url = "http://www.stats.gov.cn/ztjc/zdtjgz/zgrkpc/dqcrkpc/ggl/202105/t20210519_1817699.html"
  15. response = requests.get(url, verify=False)
  16. response.encoding = response.apparent_encoding
  17. html = response.text
  18. data = pd.read_html(html, header=0)[1]
  19. print(data)
  20. #提取数据中的某一列
  21. city = list(data["地区"])
  22. year1 = list(data["2020年"])
  23. year2 = list(data["2010年"])
  24. #将数据可视化为折线图
  25. he = {"2020年": year1, "2010年": year2}
  26. df = pd.DataFrame(he, city)
  27. df.plot.line()
  28. plt.show()

 最后展示的折线图

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/从前慢现在也慢/article/detail/696007
推荐阅读
相关标签
  

闽ICP备14008679号