当前位置:   article > 正文

爬去图片插件_Python爬虫工具:必会用的 6 款 Chrome 插件

爬图插件

前言

文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。

作者: 安果/Aripython

PS:如有需要Python学习资料的小伙伴可以加点击下方链接自行获取

http://note.youdao.com/noteshare?id=3054cce4add8a909e784ad934f956cef

ee66eb9deaa4fee323b0769670252c5b.png

在日常 PC 端的爬虫过程工作中,Chrome 浏览器是我们常用的一款工具。

鉴于 Chrome 浏览器的强大,Chrome 网上应用商店很多强大的插件可以帮助我们快速高效地进行数据爬虫。

今天推荐的 6 款 Chrome 插件,可以大大提升我们的爬虫效率。

EditThisCookie

5181db9461b7786cc652605fe4327e60.png

EditThisCookie 是一个 Cookie 管理器,可以很方便的添加,删除,编辑,搜索,锁定和屏蔽 Cookies。 可以将登录后的 Cookies 先保存到本地,借助 cookielib 库,直接爬取登录后的数据。 避免了抓包和模拟登录,帮助我们快速地进行爬虫。

Web Scraper

1f08a319c55ae4dad34b5b5b7cbf0fe6.png

Web Scraper 是一款免费的、适用于任何人,包含没有任何编程基础的爬虫工具。 操作简单,只需要鼠标点击和简单的配置,就能快速的爬取 Web 端的数据。 它支持复杂的网站结构,数据支持文本、连接、数据块、下拉加载数据块等各种数据类型。 此外,还能将爬取的数据导出到 CSV 文件中。

Xpath Helper

10e0578d3364f8899998aa8d24361f68.png

Xpath Helper 是一种结构化网页元素选择器,支持列表和单节点数据获取, 它可以快速地定位网页元素。 对比 Beautiful Soup,由于 Xpath 网页元素查找性能更有优势;Xpath 相比正则表达式编写起来更方便。 编写 Xpath 之后会实时显示匹配的数目和对应的位置,方便我们判断语句是否编写正确。

Toggle JavaScript

4f1475f9d6beede42a23751dce04d7ab.png

Toggle JavaScript 插件可以用来检测当前网页哪些元素是通过 AJAX 动态加载的。 使用它可以快速在容许加载 JS 、禁止加载 JS 两种模式中切换。

User-Agent Switcher for Chrome

58d55d58b0aa98e30988108affbbd0d1.png

User-Agent Switcher for Chrome 插件可以很方便的修改浏览器的 User-Agent。 可以模拟不同的浏览器、客户端,包含 Android、IOS 去模拟请求。 对于一些特殊网站,切换 User-Agent 可以更方便地进行数据爬取。

JSON-handle

e89dcfc4353b91cd13aa8948143c86d5.png

JSON-handle 是一款功能强大的 JSON 数据解析 Chrome 插件。 它以简单清晰的树形图样式展现 JSON 文档,并可实时编辑。 针对数据量大的场景,可以做局部选取分析。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/从前慢现在也慢/article/detail/759164
推荐阅读
相关标签
  

闽ICP备14008679号