当前位置:   article > 正文

scrapy安装详解--秒懂!_scrapy的whl包是啥

scrapy的whl包是啥

-----------------------------------通过headers中的User-Agent字段来反爬--------------------------------------------------

  • 反扒原理:爬虫默认情况下没有User-Agent
  • 解决方法:请求之前添加User-Agent即可;更好的方式是使用User-Agent池来解决(收集一堆User-Agent的方式,或者是随机生成User-Agent)
  1. import random
  2. def get_ua():
  3. first_num = random.randint(55, 62)
  4. third_num = random.randint(0, 3200)
  5. fourth_num = random.randint(0, 140)
  6. os_type = [
  7. '(Windows NT 6.1; WOW64)', '(Windows NT 10.0; WOW64)', '(X11; Linux x86_64)',
  8. '(Macintosh; Intel Mac OS X 10_12_6)'
  9. ]
  10. chrome_version = 'Chrome/{}.0.{}.{}'.format(first_num, third_num, fourth_num)
  11. ua = ' '.join(['Mozilla/5.0', random.choice(os_type), 'AppleWebKit/537.36',
  12. '(KHTML, like Gecko)', chrome_version, 'Safari/537.36']
  13. )
  14. return ua

 

 

-------------------------SCRAPY在windows 下的安装-----------------------------

常见的错误:1.VC++14 TWISTED----->没有vc++的支持,这个时候需要进行离线安装------使用.whl文件进行安装

 

whl就是一种zip包格式,但是我们需要先安装wheel模块才能安装whl包。安装很简单,我们只需要在ide中输入pip install wheel即可。这种情况是在刚刚安装好python而且从没有装过wheel模块的情形下。

 

https://www.lfd.uci.edu/~gohlke/pythonlibs/#twisted  在这个网站下载whl文件

下载好了就切换到相对应的目录下面进行cmd操作:pip install *****

2.即使在安装完成后在cmd中输入scrapy命令,出现了  uasage:。。。Availble commands:.......  相关的内容,这样仍然还没有安装完成

        scrapy bench 只要一运行就会报win32的错误------》解决:pip install  pywin32

 

3.在上面的操作都完成了之后,再使用pip   install   scrapy------进行安装

   安装正常都是没有问题了,安装好了之后,再使用scrapy bench进行测试     如果出现如下的界面,说明安装成功:

 

4.在PC 的开发环境中创建scrapy项目

   首先,现在PC中穿件一个project记得使用你所安装的  Interpreter  也就是要指定你所安装好了的python

然后在磁盘中打开该项目所在的目录:

        使用  cmd  进行操作,使用   scrapy  startproject  ****

这样就大功告成!

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/你好赵伟/article/detail/374222
推荐阅读
相关标签
  

闽ICP备14008679号