当前位置:   article > 正文

新手爬虫必备!一招搞定漂亮数据结构,这个Python库还有人不知道?_text = resp.text data = json.loads(text) code = da

text = resp.text data = json.loads(text) code = data["code"]

嗨,小鱼来了~

前言

在学习爬虫的时候,大家肯定碰到过返回的结果是json字符串格式的数据。对于这种数据我们通常使用的是json模块,将json字符串,转化为字典格式的数据,然后采用 “键值对” 方式,获取我们想要的数据。

但是存在一个问题:

我们爬取到的数据多为json数据,转化为字典后,嵌套太多。看起来密密麻麻,一团糟,毫无规律可言。

今天就告诉大家解决这个问题的宝藏Python库——pprint,这可算是一个超实用的爬虫技巧,大家赶紧拿出小本本,记录下来。

一、举例说明

下面我们以腾讯新闻为爬取对象,看看最终得到的数据是个什么样子。

  1. import requests
  2. import json
  3. china_url = 'https://view.inews.qq.com/g2/getOnsInfo?name=disease_h5'
  4. headers = {'User-Agent''Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36'}
  5. response = requests.get(url = china_url,headers = headers).json()
  6. data = json.loads(response["data"])
  7. print(type(data))
  8. print(data)
声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:【wpsshop博客】
推荐阅读
相关标签
  

闽ICP备14008679号