当前位置:   article > 正文

Tesseract-OCR 图片数字识别的样本训练_tesseract ocr数字

tesseract ocr数字

最近想利用python写一段识别穿越火线交易所各种道具价格的代码。命令行执行:

tesseract.exe grab.jpg result -l eng

使用默认的Tesseract语言库总会识别成字母或者乱码,如下图:

于是参考https://blog.csdn.net/yasi_xi/article/details/8763385这篇帖子,训练了一个对游戏中数字识别度较高的样本库。

训练样本:

待识别的图像如下图中出售价格我的CF点

python代码:

 

  1. import win32con
  2. import win32gui
  3. import pytesseract
  4. from PIL import ImageGrab
  5. import time
  6. def get_bin_table(threshold=105):
  7. # 获取灰度转二值的映射table
  8. table = []
  9. for i in range(256):
  10. if i < threshold:
  11. table.append(0)
  12. else:
  13. table.append(1)
  14. return table
  15. def grab():
  16. hwnd = win32gui.FindWindow(0, "Crossfire20170910_0000.bmp - 画图") # 获取句柄
  17. print(hwnd)
  18. left, top, right, bottom = win32gui.GetWindowRect(hwnd)
  19. print(left, top, right, bottom)
  20. win32gui.ShowWindow(hwnd, win32con.SW_SHOWNORMAL)
  21. win32gui.SetForegroundWindow(hwnd)
  22. time.sleep(0.2)
  23. img = ImageGrab.grab((870,478,913,495)) # 截图,获取需要识别的区域
  24. img.show()
  25. imggray = img.convert('L') # 转化为灰
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/Monodyee/article/detail/291724
推荐阅读
相关标签
  

闽ICP备14008679号