赞
踩
一个基于OpenCV的Python程序,可以从摄像头捕获图像并识别简单数字。您可以根据需要进行调整,包括调整图像预处理和数字识别逻辑
import cv2 import numpy as np import pytesseract # 设置Tesseract OCR的参数 custom_config = r'--oem 3 --psm 6 outputbase digits' # 打开默认摄像头 cap = cv2.VideoCapture(0) while True: # 从视频流中读取一帧 ret, frame = cap.read() # 将图像转换为灰度图像 gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY) # 对灰度图像进行高斯滤波,降噪 blurred = cv2.GaussianBlur(gray, (5, 5), 0) # 对图像进行二值化处理 _, thresh = cv2.threshold(blurred, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU) # 查找图像中的轮廓,并选出最大的轮廓 contours, _ = cv2.findContours(thresh, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE) if contours: contour = max(contours, key=cv2.contourArea) # 计算外接矩形框,并在原图上标记 x, y, w, h = cv2.boundingRect(contour) cv2.rectangle(frame, (x, y), (x + w, y + h), (0, 255, 0), 2) # 提取数字区域 roi = thresh[y:y + h, x:x + w] # 调整数字区域大小,并填充黑色背景 roi = cv2.resize(roi, (28, 28), interpolation=cv2.INTER_AREA) roi = cv2.copyMakeBorder(roi, 4, 4, 4, 4, cv2.BORDER_CONSTANT, value=(0, 0, 0)) # 执行OCR并获取数字结果 digits = pytesseract.image_to_string(roi, config=custom_config) # 显示图像和数字结果 cv2.imshow('frame', frame) cv2.imshow('roi', roi) print(digits) # 按下 'q' 键退出循环 if cv2.waitKey(1) & 0xFF == ord('q'): break # 释放摄像头 cap.release() # 关闭所有窗口 cv2.destroyAllWindows()
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。