赞
踩
OCR(Optical Character Recognition)是指使用扫描仪或数码相机对文本资料进行扫描成图像文件,然后对图像文件进行分析处理,自动识别获取文字信息及版面信息的软件
。
在读取和处理图像、图像相关的机器学习以及创建图像等任务中,Python 一直都是非常出色的语言。虽然有很多库可以进行图像处理,但在这里只重点介绍:Tesseract
安装包下载链接:
https://wwae.lanzoub.com/b04k0prcj
密码:26yo
- 下载引擎安装包,直接安装。安装方式:–>直接双击安装包 --> 选择安装路径 --> 后续所有选项点 “下一步” 安装。
- 配置环境变量,安装完后如果要在计算机正常使用需要在计算机中配置环境变量,步骤如下所示:
- 右键点击此电脑, 选择属性
- 选择点击**高级系统设置
- 选择点击**环境变量
- 在系统变量中双击Path
- 将Tesseract引擎安装的根路径添加到环境变量中去
- 依次点击确定使环境变量生效
- 打开cmd验证,输入**
tesseract -v
**验证,出现如下说明你配置好了
brew install tesseract
==> Installing dependencies for tesseract: libarchive
==> Installing tesseract dependency: libarchive
==> Pouring libarchive-3.6.1.catalina.bottle.tar.gz
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小蓝xlanll/article/detail/129635
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。