当前位置:   article > 正文

(71)--爬取拉勾网招聘信息

(71)--爬取拉勾网招聘信息

# 爬取拉勾网招聘信息

  1. from selenium import webdriver
  2. import time
  3. from lxml import etree
  4. dc = {
  5. 'phantomjs.page.customHeaders.User-Agent' : 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36'
  6. }
  7. phantom = webdriver.PhantomJS(executable_path=r'E:\Python\phantomjs-2.1.1-windows\bin\phantomjs.exe',desired_capabilities=dc)
  8. # 首次获取第一页
  9. phantom.get('https://www.lagou.com/jobs/list_')
  10. time.sleep(1)
  11. while True:
  12. # 循环获取下一页的数据
  13. page_source = phantom.page_source
  14. html = etree.HTML(page_source)
  15. job_li = html.xpath('//ul[@class="item_con_list"]/li')
  16. # print(job_li)
  17. for job in job_li:
  18. job_name = job.xpath('.//h3/text()')[0]
  19. job_time = job.xpath('.//span[@class="format-time"]/text()')[0]
  20. job_money = job.xpath('.//span[@class="money"]/text()')[0]
  21. job_edu = job.xpath('.//div[@class="li_b_l"]/text()')[2].strip()
  22. job_tag = job.xpath('.//div[@class="list_item_bot"]//div[@class="li_b_l"]/span/text()')
  23. job_company = job.xpath('.//div[@class="company_name"]/a/text()')[0]
  24. job_comindustry = job.xpath('.//div[@class="industry"]/text()')[0].strip()
  25. print(job_name,job_time,job_money,job_edu)
  26. # print(job_tag)
  27. # print(job_company)
  28. # print(job_comindustry)
  29. # 寻找下一页按钮
  30. if 'pager_next_disabled' not in page_source:
  31. phantom.find_element_by_class_name('pager_next ').click()
  32. time.sleep(0.5)
  33. else:
  34. break
  35. phantom.quit()

# 爬取结果如下:

  1. C:\Users\cz\AppData\Local\Programs\Python\Python35\python.exe E:/Python/python爬虫/20.py
  2. C:\Users\cz\AppData\Roaming\Python\Python35\site-packages\selenium\webdriver\phantomjs\webdriver.py:49: UserWarning: Selenium support for PhantomJS has been deprecated, please use headless versions of Chrome or Firefox instead
  3. warnings.warn('Selenium support for PhantomJS has been deprecated, please use headless '
  4. KOL运营经理 09:52发布 15k-20k 经验1-3年 / 大专
  5. 中高级Java工程师 09:52发布 6k-10k 经验1-3年 / 大专
  6. 最新共享项目招聘销售精英 09:52发布 5k-10k 经验不限 / 不限
  7. Python软件开发工程师 09:52发布 13k-18k 经验1-3年 / 本科
  8. 运营助理 09:52发布 4k-8k 经验不限 / 大专
  9. 短视频内容运营 09:52发布 6k-7k 经验1-3年 / 本科
  10. 在线客服 09:52发布 10k-20k 经验1-3年 / 本科
  11. 运营总监 09:52发布 12k-18k 经验3-5年 / 大专
  12. 销售经理 09:52发布 10k-15k 经验1-3年 / 本科
  13. 前端开发工程师 09:52发布 6k-10k 经验3-5年 / 本科
  14. 行政经理 09:52发布 10k-15k 经验3-5年 / 本科
  15. 行政文员/助理(双休五险一金) 09:52发布 3k-4k 经验不限 / 大专
  16. 销售助理(实习) 09:52发布 2k-4k 经验不限 / 本科
  17. 省力宝净水器销售主管 09:51发布 4k-6k 经验1-3年 / 大专
  18. 2D 3D动画师(spine MAX) 09:51发布 5k-10k 经验1-3年 / 不限
  19. KOL运营经理 09:52发布 15k-20k 经验1-3年 / 大专
  20. 中高级Java工程师 09:52发布 6k-10k 经验1-3年 / 大专
  21. 最新共享项目招聘销售精英 09:52发布 5k-10k 经验不限 / 不限
  22. Python软件开发工程师 09:52发布 13k-18k 经验1-3年 / 本科
  23. 运营助理 09:52发布 4k-8k 经验不限 / 大专
  24. 短视频内容运营 09:52发布 6k-7k 经验1-3年 / 本科
  25. 在线客服 09:52发布 10k-20k 经验1-3年 / 本科
  26. 运营总监 09:52发布 12k-18k 经验3-5年 / 大专
  27. 销售经理 09:52发布 10k-15k 经验1-3年 / 本科
  28. 前端开发工程师 09:52发布 6k-10k 经验3-5年 / 本科
  29. 行政经理 09:52发布 10k-15k 经验3-5年 / 本科
  30. 行政文员/助理(双休五险一金) 09:52发布 3k-4k 经验不限 / 大专
  31. 销售助理(实习) 09:52发布 2k-4k 经验不限 / 本科
  32. 省力宝净水器销售主管 09:51发布 4k-6k 经验1-3年 / 大专
  33. 2D 3D动画师(spine MAX) 09:51发布 5k-10k 经验1-3年 / 不限
  34. Java工程师 10:02发布 10k-20k 经验3-5年 / 大专
  35. 测试工程师 10:02发布 6k-8k 经验1-3年 / 本科
  36. 商务助理 10:02发布 3k-6k 经验1-3年 / 大专
  37. 短视频总监 10:02发布 15k-30k 经验5-10年 / 本科
  38. 室内设计师助理 10:02发布 3k-6k 经验1-3年 / 本科
  39. 采购专员 10:02发布 6k-9k 经验3-5年 / 大专
  40. 小微信贷-高级JAVA开发 10:02发布 18k-35k 经验1-3年 / 不限
  41. 行政 10:02发布 3K-5K 经验不限 / 不限
  42. 新媒体运营 10:02发布 4k-7k 经验不限 / 本科
  43. 系统售前顾问 10:02发布 5k-10k 经验1-3年 / 大专
  44. 产品运营(音乐app)实习生 10:02发布 1k-2k 经验应届毕业生 / 本科
  45. php开发工程师 10:02发布 5k-8k 经验3-5年 / 大专
  46. 视频云销售经理-华东ÿ
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/运维做开发/article/detail/939883
推荐阅读
相关标签
  

闽ICP备14008679号