赞
踩
今天在学习Python爬虫的验证码识别的时候发现tesserocr这个库的图片识别能力居然能低到离谱的程度,我都很好奇为什么崔神书上那张图片居然能识别出来。
实验的三张图片如下。
我刚开始想的是除了图一略有难度以外,图二图三应该不难识别吧?
于是我先直接对原图片进行识别。
importtesserocrfrom PIL importImage
img1= Image.open('img1.jpg')print('图片1的内容为:', tesserocr.image_to_text(img1))
img2= Image.open('img2.jpg')print('图片2的内容为:', tesserocr.image_to_text(img2))
img3= Image.open('img3.jpg')print('图片3的内容为:', tesserocr.image_to_text(img3))
结果只有图3出了内容,而且还是错误的
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。