身份证OCR识别_ocr身份证识别用的是大模型哈市小模型

作者：正经夜光杯 | 2024-06-24 23:11:17

踩

ocr身份证识别用的是大模型哈市小模型

本文章来源于自己的学习图像处理以及识别过程中的一些经验，开发了一个OCR识别身份证程序，此程序虽不够完美但有一定的参考价值，CSDN上本人也将提供源代码，对身份证OCR识别整个过程的一个梳理。

程序依赖库，OpenCV3.20 + Tesseract-OCR识别。

此程序增加了截取位置识别，以及统一化后的照片识别（900*600）像素清晰的照片进行识别，。对于截取位置识别识别率正确率在90%以上，对满足要求的照片识别率可以调优到非常好的效果。我这里就调优了一下身份证号。以上数据都还有一定的优化空间。由于时间仓促和能力问题暂时还没有检测功能，所以对于整体识别需要提供大小统一仅仅包含身份证的照片。在定位上也有不足这都是影响识别率的根本原因。也希望有兴趣的同学完善或者有好的方法留言发送给我，我会虚心学习请教。

大致过程：

1，修剪统一化图像：900*600 或者1：1.5的身份证正面照。

2，图像预处理（分割定位，图像噪声去除等）。

3，识别（模型训练调优，参数优化等）。

感觉过程很简单其实不亲自实现的走一下，不知道里面的坑大家拿到源码程序后可以看看其处理方法和步骤是否妥当和是否有更好的处理方案。

对满足要求的图像，无偏移歪斜并且清晰的的图像长宽比1：1.5的图像。如下图整体定位识别身份证号的识别完全正确，而姓名和住址由于位置不准确背景干扰大所以出现了误差。在这里定位以及图像处理非常关键。

总结：OCR识别关键技术点在于检测，定位，图像处理，后期识别。每个环节出现了误差都会影响整个正确的识别率。我这里专门对身份证号进行了模型训练所以以上所有身份证号准确率都是非常高的，同时根据二代身份证的大小特性（长度85.6毫米,宽度54毫米,厚度0.9毫米），需要手机拍摄的清晰图片修剪保留身份证大小长宽比1：1.5 等。同时软件可能还存在这样那样的问题望大家少喷一些吧。。

源码下载地址：https://download.csdn.net/download/u013709254/11125733

在源码中如果有更好的处理方案和改善优化方法以及使用过程中的问题，大家都可以邮件我：zww-1988@163.com 我将会继续分享将成果分享出来。有可能功能原因不能及时回复，请加我QQ：2892710568.期待与你们共同学习共同进步。。

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/正经夜光杯/article/detail/754285