当前位置:   article > 正文

PaddleOCR二次全流程——1. 确定字体_ocr常用中英文字体font

ocr常用中英文字体font

1. 数据(待识别内容)

在这里插入图片描述
在这里插入图片描述

要识别的内容是这样的,大致模式是:机器拍摄,然后识别屏幕上的表格文字。

2. 字体

确定字体的网站:

不过以上字体基本都需要自己在网站做一些操作,框字体区域,然后会填写当前框对应的正确字符,再去进行识别。(但是对英文来说,往往在切分字符的时候就错了,所以这里就不再去寻找字体了)
在这里插入图片描述
在这里插入图片描述
这里选择了几种和上述比较像的字体来进行替代,通过在windows默认的console里切换字体,大致可以确定这种字体是TrueType字体
在这里插入图片描述


2.1 第一个图的字体

暂定的字体:

  1. Adobe Gothic Std L
    在这里插入图片描述
  2. Microsofe Yi Baiti 这个字体看起来也不错
    在这里插入图片描述
  3. Myanmar Text 看起来也还行(英文字体都不错,都是TrueType或者OpenType字体 )
    在这里插入图片描述
  4. Myriad Arabic
    在这里插入图片描述
  5. Myriad Hebrew
    在这里插入图片描述
  6. Myriad Pro
    在这里插入图片描述
  7. Nirmala UI
    在这里插入图片描述
  8. Nirmala UI Semilight
    在这里插入图片描述
  9. OCR-A Extended
    在这里插入图片描述
  10. Segoe UI在这里插入图片描述
  11. Segoe UI Emoji
    在这里插入图片描述
  12. Segoe UI Light
    在这里插入图片描述
  13. Segoe UI SemiLight
    在这里插入图片描述
  14. Tahoma在这里插入图片描述
  15. Times New Roman在这里插入图片描述
  16. 等线light
    在这里插入图片描述

2.1 第二个图的字体

  1. Consolas(这个图基本可以确定是这个字体)
    在这里插入图片描述

2.3 寻找字体文件

由于直接是在Adobe Acrobat里切换字体的,所以直接去软件里找就好了,除了软件里带的,还有就是系统字体。

软件自带字体

参考:Adobe用户指南-PDF 字体
在windows电脑上搜索以下路径:

  • C:\Program Files (x86)\Common Files\Adobe\Fonts
  • Acrobat 文件夹中的 /Resource/Font
  • /Program Files/Common Files/Adobe/Fonts
  • C:\Program Files (x86)\Adobe\Acrobat DC\Resource\Font(最后我是在这个文件夹里找到的,不过这个文件夹里都是.otf字体,opentype类型)

系统字体
位置:

  • C:\Windows\Fonts(建议调节成详细信息显示视图,看起来会方便些)
    在这里插入图片描述

2.4 整理字体文件

当从系统字体复制的时候,可以看到,显示的是一个,但是实际上有四个,使用的时候一般只需要常规字体,所以其他几个加粗/斜体可以考虑删除了。(按需取用)
在这里插入图片描述
最后可以找到的字体是:

consola.ttf
Deng.ttf
MSGothic.ttc
SegoeUI.ttf
YuGothR.ttc

其实全都是系统字体,并没有使用到Adobe Acrobat的字体

本文内容由网友自发贡献,转载请注明出处:https://www.wpsshop.cn/w/盐析白兔/article/detail/295918
推荐阅读
相关标签
  

闽ICP备14008679号