当前位置:   article > 正文

Paddle OCR 初体验_ocr 体验

ocr 体验

Paddle OCR 使用初体验

开发环境的搭建

  1. anaconda 安装
  2. vscode 安装

注:开发环境搭建参考文档使用 Pyside 构建一个串口调试助手-CSDN博客

创建 PaddleOCR运行环境

  1. 使用 Anaconda 搭建

    conda create -n paddleOcr_env python=3.8  # 创建一个名为paddleOcr_env,版本为3.8的python虚拟环境
    conda activate paddleOcr_env			 # 激活该虚拟环境
    pip install paddlepaddle paddleocr 		  # 安装对应的库
    
    • 1
    • 2
    • 3

使用 PaddleOcr 寻找 Img 目录下的所有图片进行解析,并输出结果图片,并将结果输出到 DOCX /EXCEL 文档。

具体代码如下

import os
from PIL import Image
from paddleocr import PaddleOCR, draw_ocr
import docx
import pandas as pd

# 初始化 OCR 模型
ocr = PaddleOCR(use_angle_cls=True, lang="ch")

# 遍历 img/ 目录下的所有图片
img_dir = 'img/'
output_dir = 'output/'
os.makedirs(output_dir, exist_ok=True)

# 创建Word文档和Excel表格对象
doc = docx.Document()
data = []

for filename in os.listdir(img_dir):
    if filename.endswith('.png') or filename.endswith('.jpg') or filename.endswith('.jpeg'):
        img_path = os.path.join(img_dir, filename)
        output_path = os.path.join(output_dir, filename)

        # 进行 OCR 识别
        result = ocr.ocr(img_path, cls=True)
        boxes = [detection[0] for line in result for detection in line]
        txts = [detection[1][0] for line in result for detection in line]
        scores = [detection[1][1] for line in result for detection in line]

        # 绘制结果并保存输出图片
        image = Image.open(img_path).convert('RGB')
        im_show = draw_ocr(image, boxes, txts, scores)
        im_show = Image.fromarray(im_show)
        im_show.save(output_path)

        # 将识别结果添加到Word文档和数据列表中
        doc.add_paragraph(f"Image: {filename}")
        for line in result:
            print(line)
            doc.add_paragraph(str(line))
            data.append({'Image': filename, 'Text': str(line)})

# 保存Word文档
doc.save('ocr_results.docx')

# 创建DataFrame对象
df = pd.DataFrame(data)

# 保存Excel表格
df.to_excel('ocr_results.xlsx', index=False)

print("OCR completed!")
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
  • 32
  • 33
  • 34
  • 35
  • 36
  • 37
  • 38
  • 39
  • 40
  • 41
  • 42
  • 43
  • 44
  • 45
  • 46
  • 47
  • 48
  • 49
  • 50
  • 51
  • 52

输出结果分为两部分,一部分是位于 output 目录下的图片识别标注结果,剩下的是运行目录下的 docx/excel 文件

PaddleOcr 对于识别的结果分析

  1. 准确率90%以上,在不确定字体样式的情况下

在这里插入图片描述

  1. 有漏下的不识别的情况存在
    在这里插入图片描述

  2. 不能处理动态模糊图像,需要自己先处理,然后再识别。

  3. 其它测试待验证。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/你好赵伟/article/detail/692701
推荐阅读
相关标签
  

闽ICP备14008679号