赞
踩
目前,主流的答题卡识别软件都是基于传统的图像处理方法,经过二值化、滤波、去噪等流程提取到答题卡的填涂区域。思路正确,但是效果一般,无法广泛应用到实际中。由于答题卡的样式五花八门,考试的填涂方式千奇百怪,上述传统的图像处理方法不能很好的解决答题卡识别的痛点——即与考生填涂区域有相似噪声时,滤波和去噪过程阈值难以选择。阈值过小,不能提取出全部的填涂区域;阈值过大,会剔除掉考生的填涂结果,从而造成识别错误。从成本考虑,不是所有的答题卡都有大型考试那样严格的标准,填涂区域用红色标出(例:[A]),考生用2B铅笔填涂。更多的是黑色印刷的填涂区域背景,这样就导致如果考生填涂的不充分、不连贯、填涂浅、填涂区域被污染、填涂的形状奇怪等,就可能导致识别错误或者误识别。除此之外,在一些考试中,批卷老师更希望的是考生都有成绩,而不是因为严格的限制在填涂的方式上扣分。
针对上述问题,我们提出一种基于Python+Tkinter+OpenCV+Yolo+手写OCR的双模式答题卡识别软件,使用Python内置的GUI界面开发工具Tkinter来实现友好的用户界面。针对基于传统的图像处理方法,我们做出了巨大改进,用一种巧妙的方法来解决上述的传统图像处理方法的痛点,可以做到精确识别。针对基于深度学习的方法,我们先标注考生答题卡的填涂区域,然后使用Yolo进行训练。由于填涂区域的特征相对单一,但是填涂的样例应该广泛且具有代表性。得益于Yolo的强大,我们仅标注了100张答题卡图像,即可准确预测上千张答题卡,准确率足以应用到实际场景中。答题卡识别的速度极快,上千张答
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。