当前位置:   article > 正文

Python实战(二)—— urllib2 下载网页的方式总结_responce 下载不提示

responce 下载不提示

方法一、最简洁

 

  1. #coding:utf-8
  2. import urllib2
  3. import cookielib
  4. url='http://baidu.com'
  5. print "method 1"
  6. responce1=urllib2.urlopen(url)
  7. print responce1.getcode() #200
  8. print len(responce1.read()) #81

方法二、添加data、http header信息

 

 

  1. print "method 2"
  2. request=urllib2.Request(url)
  3. request.add_header("User-Agent","Mozilla/5.0")
  4. responce2=urllib2.urlopen(request)
  5. print responce2.getcode() #200
  6. print len(responce2.read()) #81

方法三、添加处理器

 

 

  1. print "method 3"
  2. cj=cookielib.CookieJar()
  3. opener=urllib2.build_opener(urllib2.HTTPCookieProcessor(cj))
  4. urllib2.install_opener(opener)
  5. responce3=urllib2.urlopen(url)
  6. print cj #<CookieJar[]>
  7. print responce3.getcode() #200
  8. print responce3.read() #81

 

每个方法依次升级,应用于模拟更丰富的http请求下载网页。

 

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/花生_TL007/article/detail/372890
推荐阅读
相关标签
  

闽ICP备14008679号