NLP：场景--OCR提取文字做文本匹配任务~持续更新~

作者：Cpp五条 | 2024-04-03 18:34:44

踩

NLP：场景--OCR提取文字做文本匹配任务~~~持续更新~~~

OCR

将图片上的文字提取出来，需要哪些技术？

将图片上的文字提取出来的过程通常被称为光学字符识别（Optical Character Recognition, OCR）。OCR技术可以将各种类型的文档（如扫描的纸文档、PDF文件或图像中的文字）转换成可编辑和可搜索的数据。

OCR

OCR的发展历程

OCR，全称为光学字符识别（Optical Character Recognition），是一种将图像中的打印或手写文本转换为机器编码文本的技术。OCR技术的发展经历了几个重要阶段，从早期的模板匹配和特征提取，到现代的机器学习和深度学习方法。

以下是OCR技术的发展简史：

1. **早期发展（20世纪50-70年代）**：
- 1950年代，OCR系统开始出现，主要用于简单的数据录入和处理任务。
- 早期系统通常只能识别一种字体和大小，且对字符的排列有严格要求。

2. **商业化和标准化

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/Cpp五条/article/detail/356376