当前位置:   article > 正文

python 图片文字提取_python图片文字提取

python图片文字提取

转载:python怎么读取png(python 图像处理)-天道酬勤-花开半夏

图像处理不是一件简单的工作。 对你来说,一看到某样东西,马上就知道你在看什么很容易。 但是,电脑不是这样工作的。

对你来说太难的任务,比如复杂的算术,或者一般意义上的数学,计算机都能顺利完成。 但在这里,相反——对你来说是个微不足道的任务。 例如,识别图像中的猫和狗对计算机来说真的很难。 从某种意义上说,我们是设在天造地设的一对。 至少现在是这样。

虽然图像分类和一定程度的计算机视觉相关任务可能需要大量代码和扎实的理解,但从格式良好的图像中读取文本在Python上很简单,可以适用于很多现实生活问题。

在今天的投稿中,我想证明那个。 安装一些库,但不需要很多时间。 这些是你需要的库:

OpenCVPyTesseract

OpenCV

目前,此库仅用于加载映像。 实际上,不需要事先了解太多(也许有用,但让我们看看为什么)。

根据官方文件:

OpenCV (开源计算机视觉库)是一个开源的计算机视觉机器学习软件库。 OpenCV的目的是为计算机视觉APP提供通用的基础设施,加速机器识别在商业产品上的使用。 OpenCV是bsd许可的产品,通过OpenCV,企业可以简单地使用和更改代码

简单来说,可以使用OpenCV进行所有类型的图像转换。 这是一个相当简单的库。

如果还没有安装,那只是终端中的一行。

pip install opencv-python差不多就是这样。 在那之前,一切都很简单,但这种情况很快就会改变。

PyTesseract

这个库到底是什么? 根据维基百科:

Tesseract是用于各种操作系统的光学字符识别引擎。 这是一个免费软件,基于Apache许可2.0版发布,自2006年以来由谷歌赞助开发。

确实,现在有更复杂的库,但是我发现这个库运行得很好。 根据我自己的经验,这个库应该可以从任何图像中读取文本,但是前提是字体不能让你读取。

如果无法从您的图像中读取字符,请使用OpenCV应用各种过滤器将文本转换为twdg。

现在安装在底部有点麻烦。 如果使用的是Linux,则所有命令都将合并为几个sudo-apt get命令。

获取更新

sudo apt-getinstalltesseract-ocr

sdoapt-getinstalllibtesseract-dev我在使用Windows系统,所以这个过程有点无聊。

首先,打开此URL 3:3359 github.com/u B-mannheim/tessera CT/wiki以下载32位或64位安装程序3360

安装本身很简单,只需点击几次Next即可。 是的,还需要pip安装:

接下来,pip安装模板必须告诉Python Tesseract安装在哪里。 在Linux计算机上不需要这样做,但在Windows上需要。 缺省情况下,将安装程序文件。

如果做得正确,执行这些代码应该不会发生错误:

获取文本

从简单的开始吧。 我找到了免版税的照片。 里面有文字。 第一个是这样的:

那个应该很简单。 Tesseract可能会读蓝色的“对象”作为括号。 让我们看看会发生什么,

我的推测是正确的。 但是,这不是问题。 使用Python的技巧可以很容易地解决。

下一个可能更麻烦:

希望不要检测硬币的“B”:

好像有效果。

现在轮到你把它应用于自己的问题了。 如果文本和背景混合存在,OpenCV技能在这里可能很重要。

在你离开之前

计算机来说,从图像中读取文本是相当困难的工作。 请考虑一下。 电脑不知道文字是什么。 只对数字有效。 引擎盖后面发生的事情一开始可能看起来像个黑匣子,但如果这是你感兴趣的领域,我建议你多做研究。

虽然并不是每次PyTesseract都能正常工作,但是我发现即使是复杂的图像也可以正常工作。 但是,并非所有情况都好,有时需要对背景更加强调文本twdg的图像处理。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/Li_阴宅/article/detail/799808
推荐阅读
相关标签
  

闽ICP备14008679号