赞
踩
python + opencv 读取视频中的文字(这里读取摄像头的时间)
(经过多次测试 以下代码报错率有些高 可做参考 生产使用还需完善)
import cv2 from PIL import Image video_filename = 'rtsp://xxxx/xx/xx' videoCap = cv2.VideoCapture(video_filename) # 帧频 fps = videoCap.get(cv2.CAP_PROP_FPS) # 视频总帧数 total_frames = int(videoCap.get(cv2.CAP_PROP_FRAME_COUNT)) # 图像尺寸 image_size = (int(videoCap.get(cv2.CAP_PROP_FRAME_HEIGHT)), int(videoCap.get(cv2.CAP_PROP_FRAME_WIDTH))) print(fps) # 视频帧频 print(total_frames) # 画面总数 print(image_size) # 视频图片尺寸 sucess, frame = videoCap.read() for i in range(1200): sucess, frame = videoCap.read() # img = Image.fromarray(frame) # img.show() im = frame[:, :, 0] #im = im[45:100, 1400:2000] # 只截取时间位置 im = im[45:100, :] # 确定摄像头时间的范围,索引值注意更换 img = Image.fromarray(im) # img.show() #只截取时间位置的话 thresh = 48 为最佳(根据实际情况为定) thresh = 31 _, im = cv2.threshold(im, thresh, 255, cv2.THRESH_BINARY) img = Image.fromarray(im) img.show() # 获取摄像头中的时间 # 保存图片到指定位置(我这里保存到了D盘) cv2.imwrite('D:/' + 'img' + '.jpg',im)
这是我拿到的时间
然后是从图片中把文字提取出来
这里下载识别引擎tesseract-ocr:
链接:麻烦百忙之中帮我点个赞,能收藏评论一下就更感谢了~
提取码:s3t0
安装包是麻瓜式.exe,一直next就好.
还有一些操作:
将下载的中文库
放在 Tesseract-OCR 安装目录下的 tessdata 文件夹中
然后在你的python安装位置
将 tesseract_cmd 的值 改为 Tesseract-OCR 的安装路径\tesseract.exe
最后代码只有几行:
import pytesseract
from PIL import Image
# im_en = Image.open('English.png')
im_ch = Image.open(r'D:\img.jpg')
# print('========识别字母========')
# print(pytesseract.image_to_string(im_en), '\n\n')
print('========识别中文========')
print(pytesseract.image_to_string(im_ch, lang='chi_sim'))
最后结果:
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。