当前位置:   article > 正文

一款非常牛逼的Java爬虫框架(高度灵活可配置)

java爬虫框架

介绍

平台以流程图的方式定义爬虫,是一个高度灵活可配置的爬虫平台

特性

  • 支持Xpath/JsonPath/css选择器/正则提取/混搭提取

  • 支持JSON/XML/二进制格式

  • 支持多数据源、SQL select/selectInt/selectOne/insert/update/delete

  • 支持爬取JS动态渲染(或ajax)的页面

  • 支持代理

  • 支持自动保存至数据库/文件

  • 常用字符串、日期、文件、加解密等函数

  • 支持插件扩展(自定义执行器,自定义方法)

  • 任务监控,任务日志

  • 支持HTTP接口

  • 支持Cookie自动管理

  • 支持自定义函数

插件

  • Selenium插件

  • Redis插件

  • OSS插件

  • Mongodb插件

  • IP代理池插件

  • OCR识别插件

  • 电子邮箱插件

  • 微信搜索公众号:架构师指南,回复:架构师 领取资料 。

项目部分截图

爬虫列表

93a49acc205acfd1ba804817dcf12043.png

爬虫测试9d24b1814454e262938007c5bb353d5a.gif

Debug

c0bc0861fba0edf3ba4451a7e0643d39.png

日志

1f6e2c6f45fc5a55fe7977b1036c6d95.png

免责声明

请勿将spider-flow应用到任何可能会违反法律规定和道德约束的工作中,请友善使用spider-flow,遵守蜘蛛协议,不要将spider-flow用于任何非法用途。

如您选择使用spider-flow即代表您遵守此协议,作者不承担任何由于您违反此协议带来任何的法律风险和损失,一切后果由您承担。

开源地址

https://gitee.com/ssssssss-team/spider-flow

官网:

https://www.spiderflow.org/

 
 

PS:如果觉得我的分享不错,欢迎大家随手点赞、在看。

 
 

 关注公众号:Java后端编程,回复下面关键字 

 
 

要Java学习完整路线,回复  路线 

缺Java入门视频,回复: 视频 

要Java面试经验,回复  面试 

缺Java项目,回复: 项目 

进Java粉丝群: 加群 

 
 

PS:如果觉得我的分享不错,欢迎大家随手点赞、在看。

 
 

(完)

加我"微信" 获取一份 最新Java面试题资料

2cd7f21be0df18eb94fa54674ae4ef98.jpeg

请备注:666,不然不通过~

最近好文

1、必须推荐的一个后台管理系统

2、无意中发现了一位清华妹子的资料库!

3、Java后端编程读者群正式成立了!

4、一套简单通用的Java后台管理系统,拿来即用

5、36 张图梳理 Intellij IDEA 常用设置

 
 

outside_default.png

 
 
  1. 最近面试BAT,整理一份面试资料《Java面试BAT通关手册》,覆盖了Java核心技术、JVM、Java并发、SSM、微服务、数据库、数据结构等等。
  2. 获取方式:关注公众号并回复 java 领取,更多内容陆续奉上。

明天见(。・ω・。)ノ♡

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/Monodyee/article/detail/173842
推荐阅读
相关标签
  

闽ICP备14008679号