当前位置:   article > 正文

Android ORC文字识别之识别身份证号等(附源码)_android ocr 身份证

android ocr 身份证
项目地址
https://github.com/979451341/OrcTest

我们说说实现这个项目已实现的功能,能够截图手机界面的某一块,将这个某一块图片的Bitmap传给tess-two的代码来获取扫描结果

我这里在贴出tess-two这个专为Android而创建的文字识别框架的地址
https://github.com/rmtheis/tess-two

接下来我就说我如何一步一步的实现项目

1.实现基础界面,我这里贴出已完成的界面


这样是为了模仿扫描二维码的界面,因为扫描身份证号码或者是手机号那样长条的数字,就将扫描区域也做成长条状,这个扫描区域是有意义的,因为到时候截图会只将扫描区域里的图片信息拿去扫描,这也是为了提高扫描速度和精度。

首先要实现这个界面,我们需要画出四个灰色长方体的位置大小,上下左右。

left是扫描区域左边离手机屏幕左边的距离是手机屏幕宽度的1/10,right就是扫描区域右边离手机屏幕左边的距离是手机屏幕宽度的9/10,top是扫描区域顶部离手机屏幕顶部的距离是手机屏幕宽度的1/3,bottom是扫描区域底部离手机屏幕顶部的距离是手机屏幕宽度的4/9

  1. WindowManager manager = (WindowManager) context.getSystemService(Context.WINDOW_SERVICE);
  2. Display display = manager.getDefaultDisplay();
  3. PMwidth = display.getWidth();
  4. PMheight = display.getHeight();
  5. left = PMwidth/10;
  6. top = PMheight/3;
  7. right = PMwidth*9/10;
  8. bottom = PMheight*4/9;
  9. mFrameRect = new Rect(left,top,right,bottom);

画画

  1. @Override
  2. public void onDraw(Canvas canvas) {
  3. int width = PMwidth;
  4. int height = PMheight;
  5. Rect frame = mFrameRect;
  6. // 绘制焦点框外边的暗色背景
  7. mPaint.setColor(mMaskColor);
  8. canvas.drawRect(0, 0, width, frame.top, mPaint);
  9. canvas.drawRect(0, frame.top, frame.left, frame.bottom + 1, mPaint);
  10. canvas.drawRect(frame.right + 1, frame.top, width, frame.bottom + 1, mPaint);
  11. canvas.drawRect(0, frame.bottom + 1, width, height, mPaint);
  12. }

还没有完,还有布局文件放SurfaceView和按钮,还有刚才做的自定义View

2.显示Camera预览和Camera拍摄


这里SurfaceView如何显示Camera我不多说,只说如何把Camera预览变清晰,这里是通过循环自动对焦来完成。

设置自动对焦接口

mCamera.autoFocus(autoFocusCallback);

这个接口初始化传入了Handler

autoFocusCallback.setHandler(handler,MSG_AUTOFUCS);

然后这个接口实现类里,当完成自动对焦,会通过handler发送一个消息

  1. @Override
  2. public void onAutoFocus(boolean success, Camera camera) {
  3. Log.v("zzw", "autof focus "+success);
  4. if (mAutoFocusHandler != null) {
  5. mAutoFocusHandler.sendEmptyMessageDelayed(mAutoFocusMessage,AUTO_FOCUS_INTERVAL_MS);
  6. // mAutoFocusHandler = null;
  7. } else {
  8. Log.v(TAG, "Got auto-focus callback, but no handler for it");
  9. }
  10. }

然后handler如何执行以下代码,再进行一次自动对焦,这样就完成了循环

  1. case MSG_AUTOFUCS:
  2. cameraUtil.autoFocus();
  3. break;

然后给按钮赋予拍摄功能,拍摄的还要停止聚焦

  1. handler.removeCallbacksAndMessages(null);
  2. cameraUtil.takePicture(TwoActivity.this,TwoActivity.this,TwoActivity.this);

这个函数会被调用,data就是图片数据

  1. @Override
  2. public void onPictureTaken(byte[] data, Camera camera)

这里要注意一件事,拍摄后Camera预览界面就会停止,因为他停止聚焦了,我们需要重新设置自动对焦,并开启预览

  1. // 刷新相机
  2. public void refreshCamera(){
  3. if (surfaceHolder.getSurface() == null){
  4. // preview surface does not exist
  5. return;
  6. }
  7. // stop preview before making changes
  8. try {
  9. mCamera.stopPreview();
  10. } catch(Exception e){
  11. // ignore: tried to stop a non-existent preview
  12. }
  13. // set preview size and make any resize, rotate or
  14. // reformatting changes here
  15. // start preview with new settings
  16. try {
  17. mCamera.setPreviewDisplay(surfaceHolder);
  18. mCamera.startPreview();
  19. mCamera.autoFocus(autoFocusCallback);
  20. } catch (Exception e) {
  21. }
  22. surfaceHolder.setType(SurfaceHolder.SURFACE_TYPE_PUSH_BUFFERS);
  23. }

3.处理图片数据,完成局部截图


继续在onPictureTaken函数的data数据处理

因为处理图片是耗时任务,所以开启子线程完成

这里先开启一个等待对话框

  1. if(!mypDialog.isShowing())
  2. mypDialog.show();

然后开启子线程

  1. if(data != null){
  2. new Thread(new BitmapThread(bitmap,data,handler,TwoActivity.this)).start();
  3. }

将data转换为Bitmap数据

        bitmap = BitmapFactory.decodeByteArray(data, 0, data.length);

将图片旋转90度

        bitmap = rotateBitmap(bitmap,90);
这是旋转Bitmap的函数
  1. public static Bitmap rotateBitmap(Bitmap source, float angle) {
  2. Matrix matrix = new Matrix();
  3. matrix.postRotate(angle);
  4. return Bitmap.createBitmap(source, 0, 0, source.getWidth(), source.getHeight(), matrix, true);
  5. }

切割Bitmap,将扫描区域的图片切割出来

  1. int PMwidth = bitmap.getWidth(); // 得到图片的宽,高
  2. int PMheight = bitmap.getHeight();
  3. int left = PMwidth/10;
  4. int top = PMheight/3;
  5. int right = PMwidth*9/10;
  6. int bottom = PMheight*4/9;
  7. int width = right - left;
  8. int height = bottom - top;
  9. Log.v("zzw",PMheight+" "+PMwidth);
  10. bitmap = Bitmap.createBitmap(bitmap, left, top, width, height, null,
  11. false);

4.扫描出结果


其实tess-two框架的使用很简单,但是使用这个框架需要依靠训练文件来完成扫描,我在res目录下放了raw文件夹,里面的eng_traineddata文件就是这个用途,但是我们不能直接使用它们,我们需要将他们复制到手机存储里

下面的代码意思是在应用私有路径里创建tesseract/tessdata/eng.traineddata相关路径的文件并使用输入流将文件的数据读出来,然后使用输出流将数据传入eng.traineddata文件

  1. public static void initTessTrainedData(Context context){
  2. if(initiated){
  3. return;
  4. }
  5. File appFolder = context.getFilesDir();
  6. File folder = new File(appFolder, tessdir);
  7. if(!folder.exists()){
  8. folder.mkdir();
  9. }
  10. tesseractFolder = folder.getAbsolutePath();
  11. File subfolder = new File(folder, subdir);
  12. if(!subfolder.exists()){
  13. subfolder.mkdir();
  14. }
  15. File file = new File(subfolder, filename);
  16. trainedDataPath = file.getAbsolutePath();
  17. Log.d(TAG, "Trained data filepath: " + trainedDataPath);
  18. if(!file.exists()) {
  19. try {
  20. FileOutputStream fileOutputStream;
  21. byte[] bytes = readRawTrainingData(context);
  22. if (bytes == null){
  23. return;
  24. }
  25. fileOutputStream = new FileOutputStream(file);
  26. fileOutputStream.write(bytes);
  27. fileOutputStream.close();
  28. initiated = true;
  29. Log.d(TAG, "Prepared training data file");
  30. } catch (FileNotFoundException e) {
  31. Log.e(TAG, "Error opening training data file\n" + e.getMessage());
  32. } catch (IOException e) {
  33. Log.e(TAG, "Error opening training data file\n" + e.getMessage());
  34. }
  35. }
  36. else{
  37. initiated = true;
  38. }
  39. }

好了再说说tess-two框架的使用

创建TessBaseAPI

        TessBaseAPI tessBaseAPI = new TessBaseAPI();

关闭测试

        tessBaseAPI.setDebug(true);

设置训练数据路径和识别文字是英文

        tessBaseAPI.init(path, "eng");

 设置白名单

        tessBaseAPI.setVariable(TessBaseAPI.VAR_CHAR_WHITELIST, "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789");

设置黑名单

        tessBaseAPI.setVariable(TessBaseAPI.VAR_CHAR_BLACKLIST, "!@#$%^&*()_+=-[]}{;:'\"\\|~`,./<>?"); 

设置识别模式

        tessBaseAPI.setPageSegMode(TessBaseAPI.PageSegMode.PSM_AUTO_OSD);

传入bitmap数据

        tessBaseAPI.setImage(bitmap);

获取扫描结果

        String inspection = tessBaseAPI.getHOCRText(0);

结束TestBaseAPI的使用

        tessBaseAPI.end();

实现扫描身份证号码,这里是通过正则表达式来判断扫描出的结果是否有身份证号码,也就是说tess-two其实是只是扫描出Bitmap文件里面有哪些文字,然后使用正则表达式来筛选出我们需要的数据。也就是说我们通过换取正则表达式就能做到扫描手机号等,带有某种规律的数字或者字母

这是正则表达式的线上工具地址,大家可以自己试试 http://tool.oschina.net/regex/#

  1. private static Pattern pattern = Pattern.compile("\\d{17}[\\d|x]|\\d{15}");
  2. public static String getTelNum(String sParam){
  3. if(TextUtils.isEmpty(sParam)){
  4. return "";
  5. }
  6. Matcher matcher = pattern.matcher(sParam);
  7. StringBuilder bf = new StringBuilder();
  8. while (matcher.find()) {
  9. bf.append(matcher.group()).append(",");
  10. }
  11. int len = bf.length();
  12. if (len > 0) {
  13. bf.deleteCharAt(len - 1);
  14. }
  15. return bf.toString();
  16. }

然后通过handler返回结果

  1. Message message = Message.obtain();
  2. message.what = 1;
  3. Bundle bundle = new Bundle();
  4. bundle.putString("decode",strDecode);
  5. message.setData(bundle);
  6. message.what = TwoActivity.MSG_BITMAP;
  7. handler.sendMessage(message);

取消加载框,并将局部截图的图像和扫描的结果通过DialogFragment显示出来

  1. mypDialog.dismiss();
  2. String strDecode = msg.getData().getString("decode","扫描失败");
  3. if(strDecode == null ||strDecode.equals(""))
  4. strDecode = "扫描失败";
  5. imageDialogFragment.setImage(bitmap);
  6. imageDialogFragment.setText(strDecode);
  7. imageDialogFragment.show(getFragmentManager(), "ImageDialogFragment");


5.结论


其实还没有结束因为我本想做出一个能够扫描整张身份证的项目,我看一下网上有很多API都能实现这个功能,但都要钱,如果要是能够实现这个功能,并发到github,我岂不是成为大神了。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小丑西瓜9/article/detail/231309
推荐阅读
相关标签
  

闽ICP备14008679号