17K star！Github上最好用的OCR文字识别开源项目，可离线使用！_开源免费的离线ocr

作者：小丑西瓜9 | 2024-06-06 13:45:49

踩

开源免费的离线ocr

最近基哥在整理项目文档，大量的图片资料需要通过OCR来转录成文字版保存。我习惯性地来到Github上，想找找有没有趁手的开源工具。

不负众望，经过我一番寻找，还是找到了一款好用的免费，开源，可批量的离线的OCR软件——Umi-OCR！目前在Github已经超过了17K Star。

Umi-OCR是基于PaddleOCR开发的，支持截图OCR 、批量OCR 、二维码等功能。项目所有代码开源免费，解压即用，适用于 Windows7 x64 及以上的电脑系统。

1、软件发布包下载为 .7z 压缩包或 .7z.exe 自解压包。自解压包可在没有安装压缩软件的电脑上，解压文件。

2、软件无需安装。

3、解压后，点击 Umi-OCR.exe 即可启动程序。

Umi-OCR 支持的界面多国语言。

首次打开软件时，将会按照你的电脑的系统设置，自动切换语言，如果需要手动切换语言。

同时支持主题颜色、字体大小等UI界面自定义设置。

Umi-OCR 的功能非常丰富实用，下来由基哥给大家讲解一下：

截图OCR：可以通过拖拽上传图片或者复制图片链接，当然最方便的肯定是直接屏幕截图了，截图完成后会自动进行OCR识别，在右边可以查看识别记录，支持编辑、复制、粘贴文本，相当方便。

段落合并：可以整理OCR完成后文本排版和顺序，使文本更适合阅读和使用。这个功能是真的强，以往的软件识别完成后都是断断续续的，排版还得调很久，这个段落功能直接帮你处理好，可以最大程度地保留原文本的排版结构。

批量OCR：支持批量导入本地图片并识别，几百张图片都可以，如果实在太多，还可以设置完成后自动关机。支持 txt / jsonl / md / csv(Excel) 等多种格式，

忽略区域：批量OCR中的一种非常有用的功能，适用于排除图片中的不想要的文字，比如我这张网站截图，我不需要识别网址，那就给他拖拽出一个深灰色的框，这样软件就不会忽略这个区域了。

这个功能真的太爽了！进一步减少了OCR识别后再手动删除文本的繁杂操作。

二维码：可截图/粘贴/拖入本地图片来识别二维码的内容，同时也支持输入文本创建新的二维码，非常方便！

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/小丑西瓜9/article/detail/681176