当前位置:   article > 正文

python抓取网站88titienmae88中的“图片区”的第一页的所有图片

88tit
  1. #-*-coding:utf-8-*-
  2. from urllib.request import urlopen, urlretrieve
  3. from bs4 import BeautifulSoup
  4. import re
  5. import os
  6. '''
  7. 抓取网站http://jyghf.com/中的“图片区”的第一页的所有图片
  8. 关于这个网站,大家不要太有纠结的情绪,作为一个泱泱大国的男士,第一个爬虫,必须要有作为,作为啊!!!
  9. '''
  10. '''
  11. 第一步,进入到图片类中:根据http://jyghf.com/的html分析:
  12. 在id='top_box'的div中,第一个class='menu'的div包含着所有的“图片区”分类。
  13. 这些分类的url都是以“/p”开头,如:/p01/index.html,全路径: http://jyghf.com/p01/index.html
  14. '''
  15. '''
  16. 第二步,进入到图片文件夹中:根据http://jyghf.com/p01/index.html的html分析
  17. 在class="typelist"的div中,图片路径都在“<li>”标签中,这些图片路径都是以“/htm/”开头
  18. 如:“/htm/2017/12/13/p01/393067.html”,全路径:“http://jyghf.com/htm/2017/12/13/p01/393067.html”
  19. '''
  20. '''
  21. 第三步,获取图片的下
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/Monodyee/article/detail/480744
推荐阅读
相关标签
  

闽ICP备14008679号