当前位置:   article > 正文

requests+beautifulsoup4+mysql实现网络数据获取和存取_用requests和beautifulsoup实现boss直聘招聘数据爬取保存至mysql的详细过程

用requests和beautifulsoup实现boss直聘招聘数据爬取保存至mysql的详细过程

1、找到自己想爬取的网页内容

这是我从链家网上找的某个小区的页面网址,接下来就爬取这上面的房源信息

url = 'https://sh.lianjia.com/chengjiao/c5011000012404/?sug=%E5%A4%A9%E9%A6%A8%E8%8A%B1%E5%9B%AD%28%E5%85%AC%E5%AF%93%29'

直接开始操作,先导入一些需要的python库

  1. import requests as rq
  2. import numpy as np
  3. from bs4 import BeautifulSoup

然后就可以直接开始爬取数据了

  1. r = rq.get(url,headers = headers)
  2. html = r.text
  3. #用bs4处理爬取的数据
  4. doc = BeautifulSoup(html,'html.parser')
  5. #找到需要的数据部分,找到对应的div
  6. ul_data = doc.find_all('div',class_ = 'info')

headers = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/很楠不爱3/article/detail/196558
推荐阅读
相关标签
  

闽ICP备14008679号