当前位置:   article > 正文

【基础】【Python网络爬虫】【10.验证码处理】OCR识别,Tesseract ,ddddocn识别,打码平台,滑块验证码(附大量案例代码)(建议收藏)_验证码识别 ocr python

验证码识别 ocr python

验证码处理

一. OCR识别

OCR(Optical Character Recognition)是指使用扫描仪或数码相机对文本资料进行扫描成图像文件,然后对图像文件进行分析处理,自动识别获取文字信息及版面信息的软件

在读取和处理图像、图像相关的机器学习以及创建图像等任务中,Python 一直都是非常出色的语言。虽然有很多库可以进行图像处理,但在这里只重点介绍:Tesseract

1. Tesseract 引擎的安装

windows引擎环境安装

安装包下载链接:
https://wwae.lanzoub.com/b04k0prcj
密码:26yo

  • 下载引擎安装包,直接安装。安装方式:–>直接双击安装包 --> 选择安装路径 --> 后续所有选项点 “下一步” 安装。
  • 配置环境变量,安装完后如果要在计算机正常使用需要在计算机中配置环境变量,步骤如下所示:
    • 右键点击此电脑, 选择属性
      在这里插入图片描述
    • 选择点击**高级系统设置
      在这里插入图片描述
    • 选择点击**环境变量
      在这里插入图片描述
    • 系统变量中双击Path
      在这里插入图片描述
    • Tesseract引擎安装的根路径添加到环境变量中去
      在这里插入图片描述
    • 依次点击确定使环境变量生效
      在这里插入图片描述
    • 打开cmd验证,输入**tesseract -v **验证,出现如下说明你配置好了
      在这里插入图片描述

Mac系统引擎环境安装

安装 tesseract
brew install tesseract

==> Installing dependencies for tesseract: libarchive
==> Installing tesseract dependency: libarchive
==> Pouring libarchive-3.6.1.catalina.bottle.tar.gz
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/不正经/article/detail/722307
推荐阅读
相关标签