当前位置:   article > 正文

懒人精灵安卓版纯本地离线文字识别插件

懒人精灵安卓版纯本地离线文字识别插件

目的

        懒人精灵是一款可以模拟鼠标和键盘操作的自动化工具。它可以帮助用户自动完成一些重复的、繁琐的任务,节省大量人工操作的时间。懒人精灵也包含图色功能,识别屏幕上的图像,根据图像的变化自动执行相应的操作。本篇文章主要讲解下更优秀的懒人精灵TomatoOCR纯本地离线文字识别插件如何使用和集成。

        目前懒人精灵推出的普通版和高级版,对应的文字识别插件也分普通版和高级版。

准备工作

1、下载懒人精灵手机助手开发工具:懒人精灵官网,网站中只能下载高级版的编辑器,普通版的编辑器需在官方群中获取。

        

2、下载TomatoOCR纯本地离线文字识别插件

  • 目前插件支持中英文、繁体字、日语、韩语识别;
  • 支持小图、区域图和单行文字识别,准确率高达99%;
  • 支持多种返回格式,json\文本\数字\自定义;
  • 支持增强版二值化;
  • 支持找字返回坐标并点击;
  • 超高的稳定性,速度快;
  • 不联网、不联网、不联网;

插件集成

普通版和高级版的用法大同小异,下面以高级版用法为例:

1、打开懒人精灵,新建项目,双击资源.rc文件,添加文字识别插件

下载插件后,先改名为TomatoOCR.apk

2、记事本打开调用说明文件,并拷贝到项目的lua文件中,

  1. -- ********************************************************************************************
  2. -- ********欢迎使用TomatoOCR文字识别插件,加入群【469843332】可获取最新版本!!!************
  3. -- ********************************************************************************************
  4. import('java.io.File')
  5. import('java.lang.*')
  6. import('java.util.Arrays')
  7. import('android.content.Context')
  8. import('android.hardware.Sensor')
  9. import('android.hardware.SensorEvent')
  10. import('android.hardware.SensorEventListener')
  11. import('android.hardware.SensorManager')
  12. import('com.nx.assist.lua.LuaEngine')
  13. -- 推荐方式一,稳定;方式二,懒人精灵软件不怎么稳定,慎用,按方式一测试完成,可用方式二打包
  14. -------------------------引入方式-------------------------
  15. -- 方式一 根据实际情况选择适当的apk包,放在手机目录中,例子是放在了根目录并重命名为TomatoOCR
  16. --local loader = LuaEngine.loadApk("/storage/emulated/0/TomatoOCR.apk")
  17. -- 方式二 PC端左侧展开项目,找到资源目录,双击.rc文件,然后添加文件就可以了
  18. local loader = LuaEngine.loadApk("TomatoOCR.apk")
  19. -------------------------引入方式-------------------------
  20. local OCR = loader.loadClass("com.tomato.ocr.lr.OCRApi")
  21. local rec_type = "ch-3.0";
  22. -- 注:chch-2.0ch-3.0版可切换使用,对部分场景可适当调整
  23. -- "ch":普通中英文识别,1.0版模型
  24. -- "ch-2.0":普通中英文识别,2.0版模型
  25. -- "ch-3.0":普通中英文识别,3.0版模型
  26. -- "cht":繁体,"japan":日语,"korean":韩语
  27. local ocr = OCR.init(LuaEngine.getContext(), rec_type)
  28. -- license从群中获取或者网盘中获取
  29. local license = ""
  30. local flag = ocr.setLicense(license);
  31. -- ----------------------------注:以上代码全局只需写一次-------------------------------
  32. ocr.setRecType(rec_type) -- 如果需要切换语言,直接在这里设置即可
  33. ocr.setDetBoxType("rect") -- 调整检测模型检测文本参数- 默认"rect": 由于手机上截图文本均为矩形文本,从该版本之后均改为rect,"quad":可准确检测倾斜文本
  34. ocr.setDetUnclipRatio(1.9) -- 调整检测模型检测文本参数 - 默认1.9: 值范围1.6-2.5之间
  35. ocr.setRecScoreThreshold(0.3) -- 识别得分过滤 - 默认0.1,值范围0.1-0.9之间
  36. ocr.setReturnType("json")
  37. -- 返回类型 - 默认"json": 包含得分、坐标和文字;
  38. -- "text":纯文字;
  39. -- "num":纯数字;
  40. -- 自定义输入想要返回的文本:".¥1234567890",仅只返回这些内容
  41. -- ocr.setBinaryThresh(135) -- 二值化设定0-255,非必须,常规情况下不需要设置,可配合群中【测试应用.apk】使用
  42. local type = 3;
  43. -- type 可传可不传
  44. -- type=0 : 只检测
  45. -- type=1 : 方向分类 + 识别
  46. -- type=2 : 只识别
  47. -- type=3 : 检测 + 识别
  48. -- 只检测文字位置:type=0
  49. -- 全屏识别: type=3或者不传type
  50. -- 截取单行文字识别:type=1或者type=2
  51. -- 注意:注意:注意:识别不到时,返回的是""空字符串,请加上 if result ~="" then
  52. -- 例子一
  53. snapShot("/mnt/sdcard/test.png",0,0,300,100)
  54. local result1 = ocr.ocrFile("/mnt/sdcard/test.png", type)
  55. printEx(result1);
  56. -- 例子二
  57. local bitmap = LuaEngine.snapShot(0,0,300,100)
  58. local result2 = ocr.ocrBitmap(bitmap, type)
  59. printEx(result2);
  60. -- 找字返回坐标,没有找到字返回“”空字符串,返回的是“百度”的中心点坐标
  61. local point = ocr.findTapPoint("百度")
  62. if point ~="" then
  63. local json_point = jsonLib.decode(point)
  64. local center_x = json_point[1] + x1
  65. local center_y = json_point[2] + y1
  66. end
  67. -- 释放
  68. ocr.release()

3、其中的方法说明如下

方法名说明
init初始化
setRecType

设置识别语言,默认ch-3.0:

ch、ch-2.0、ch-3.0版可切换使用,对部分场景可适当调整
"ch":普通中英文识别,1.0版模型
"ch-2.0":普通中英文识别,2.0版模型
 "ch-3.0":普通中英文识别,3.0版模型
 "cht":繁体,"japan":日语,"korean":韩语

setDetBoxType

调整检测模型检测文本参数-,默认"rect":

由于手机上截图文本均为矩形文本,从该版本之后均改为rect,"quad":可准确检测倾斜文本

setDetUnclipRatio
调整检测模型检测文本参数,默认1.9:
值范围1.6-2.5之间,如果文字的检测框太小,可调整改参数,一般往大调整
setRecScoreThreshold
设置识别得分过滤,默认0.1:
值范围0.1-0.9之间
setReturnType
设置返回类型,默认"json",包含得分、坐标和文字;
"text":纯文字;
"num":纯数字;
自定义输入想要返回的文本:".¥1234567890",仅只返回这些内容
setBinaryThresh
对图片进行二值化处理,非必须,正常情况下可以不用写
ocrFile

两个参数,图片路径和类型,一般类型传3:

type=-1 : 检测 + 方向分类 + 识别
type=0 : 只检测
type=1 : 方向分类 + 识别
type=2 : 只识别(单行识别)
type=3 : 检测 + 识别
只检测文字位置:type=0
全屏识别: type=3或者不传type
截取单行文字识别:type=1或者type=2

如果识别为不到时,返回的数据为“”字符串

findTapPoint

找字,返回传入字的中心点坐标,方便进行点击,找不到字时,返回[-1,-1]

release释放插件,只需要在停止脚本的时候调用

4、识别结果

以上就是所有的运行情况。

注意:高级版需要将“脚本运行在最高权限环境中”的勾去掉

完毕

        相对来说,在懒人精灵进行插件开发还是比较困难的,需要会原生安卓开发,本地识别全屏会相对较慢,区域识别还是非常快,相比部署在服务器上,还可以减少了很多资源占用情况,更加方便便捷。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/weixin_40725706/article/detail/905475
推荐阅读
相关标签
  

闽ICP备14008679号