当前位置:   article > 正文

【爬虫神器 pyppeteer】比 selenium 更高效的爬虫利器--pyppeteer_比selenium更好用的爬虫

比selenium更好用的爬虫

Puppeteer 是 Google 基于 Node.js 开发的工具,调用 Chrome 的 API,通过 JavaScript 代码来操纵 Chrome 完成一些操作,用于网络爬虫、Web 程序自动测试等。pyppeteer 使用了 Python 异步协程库 asyncio,可整合 Scrapy 进行分布式爬虫。要注意的是它执行python3.6+以后版本使用,下面我们一起来了解下如何使用。

安装:

pip install pyppeteer
  • 1

说明:

  • 当你第一次运行 pyppeteer 时,它会下载最新版本的 Chromium
    (~100MB)。如果您不喜欢这种行为,请pyppeteer-install在运行使用 pyppeteer 的脚本之前运行命令。
  • Pyppeteer 与 puppeteer 一样相似,但 python 和 JavaScript 之间的一些差异使其变得困难。 这些是
    puppeteer 和 pyppeteer 之间的区别。

例子使用:我们使用pyppeteer 对百度网页进行截图操作:

# -*- coding: utf-8 -*-
import asyncio
from pyppeteer import launch
import os
save_path
  • 1
  • 2
  • 3
  • 4
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/weixin_40725706/article/detail/991446
推荐阅读
相关标签
  

闽ICP备14008679号