数据可视化灵魂

这个屌丝很懒，什么也没留下！

热门标签

article

Java实现CR-图片文字识别功能（超简单）

作者：数据可视化灵魂 | 2024-01-16 13:07:57

踩

一.什么是OCR

OCR （Optical Character Recognition，光学字符识别）是指电子设备（例如扫描仪或数码相机）检查纸上打印的字符，通过检测暗、亮的模式确定其形状，然后用字符识别方法将形状翻译成计算机文字的过程

方案	说明
百度OCR	收费
Tesseract-OCR	Google维护的开源OCR引擎，支持Java，Python等语言调用
Tess4J	封装了Tesseract-OCR ，支持Java调用

二.Tesseract-OCR 的特点

Tesseract支持UTF-8编码格式，并且可以“开箱即用”地识别100多种语言
Tesseract支持多种输出格式：纯文本，hOCR（HTML），PDF等
官方建议，为了获得更好的OCR结果，最好提供给高质量的图像
Tesseract进行识别其他语言的训练，具体的训练方式请参考官方提供的文档：Tesseract User Manual | tessdocTesseract documentationhttps://tesseract-ocr.github.io/tessdoc/

三.使用案例

1.导入相关的依赖

XML

<dependency>
    <groupId>net.sourceforge.tess4j</groupId>
    <artifactId>tess4j</artifactId>
    <version>4.1.1</version>
</dependency>

2.导入中文字体库

地址: tessdata.zip - 蓝奏云文件大小：1.6 M|https://wwvc.lanzouj.com/iuPhc1h7j46f

3.编写测试类进行测试

待识别的图片

测试程序

JAVA

package com.atguigu.gulimall.search.utils;

import net.sourceforge.tess4j.Tesseract;
import net.sourceforge.tess4j.TesseractException;

import java.io.File;

/**
 * @author Jason Gong
 * @version 1.0
 * @Date 2023/12/8
 * @Description
 */
public class Main {

    /**
     * 识别图片中的文字
     *
     * @param args
     */
    public static void main(String[] args) throws TesseractException {
        //创建实例
        Tesseract tesseract = new Tesseract();
        //设置字体库的路径
        tesseract.setDatapath("C:\\Users\\c2405\\Desktop\\tessdata");
        //设置语言
        //字体库为chi_sim.traineddata,语言取.前面的内容,即文件名
        //简体中文
        tesseract.setLanguage("chi_sim");
        //识别图片
        String ocr = tesseract.doOCR(new File("C:\\Users\\c2405\\Desktop\\apic21002.jpg"));
        //打印识别的结果
        //打印的时候可以去除回车和tab空格
        //System.out.println(ocr.replaceAll("\\n|\\r","-"));
        System.out.println(ocr);
    }
}

识别的结果

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/blog/article/detail/39883

推荐阅读

article
java Web实现用户登录功能_javaweb写一个登录注册界面
文章浏览阅读7.5k次，点赞18次，收藏249次。登录页面login.jsp，输入用户名和密码后，跳转到登录处理程序LoginServlet进行业务逻辑处理，调用服务层，服务层调用数据访问层（DAO），连接数据库，查询数据库，以此判断是否登... [详细]
赞
踩
article
[ 云计算 | AWS 实践 ] 使用 Java 检查指定的密钥是否存在于给定的 Amazon S3 存储桶中
文章浏览阅读3k次，点赞26次，收藏27次。在本博文中，我们将探讨如何使用Java检查指定的秘钥是否存在于亚马逊S3存储桶中。AmazonS3是一个非常流行的云存储服务，为存储和检索数据提供了可伸缩、安全和高可用的平台。就个人而言，后续很多... [详细]
赞
踩
article
[ 云计算 | AWS 实践 ] 使用 Java 更新现有 Amazon S3 对象
文章浏览阅读3.7k次，点赞36次，收藏28次。AmazonSimpleStorageService（AmazonS3）是一种广泛使用的存储服务，提供了可扩展、安全和持久的对象存储功能。在某些情况下，我们需要更新已存在于AmazonS3中的... [详细]
赞
踩
article
Java 算法篇-深入了解单链表的反转（实现：用 5 种方式来具体实现）
单链表的反转是指将链表中的节点顺序逆转，即原先的链表尾部变成了头部，头部变成了尾部。比如，[1,2,3,4,5,6,7]将这个链表的值反转得到的结果为：[7,6,5,4,3,2,1]，需要注意的是，可以用值打印出来会更好观察链表反转后的结果... [详细]
赞
踩
article
如何在 Java 中将 InputStream 读取/转换为字符串？_inputstream转字符串
如果您有一个java.io.InputStream对象，您应该如何处理该对象并生成一个String？假设我有一个包含文本数据的InputStream，并且我想将其转换为String，例如，我可以将其写入日志文件。获取InputStream并... [详细]
赞
踩
article
猿创征文｜弃文从工，从小白到蚂蚁工程师，我的 Java 成长之路
最近CSDN开展了猿创征文，希望博主写文章讲述自己在某个领域的技术成长历程。之前也曾想找个机会写篇文章，记录下自己的成长历程。因此，借着这个机会写下这篇文章。!猿创征文｜弃文从工，从小白到蚂蚁工程师，我的Java成长之路一、前言1.1背景最... [详细]
赞
踩
article
【Java】你掌握了多线程吗？
互联网的每一个角落，无论是大型电商平台的秒杀活动，社交平台的实时消息推送，还是在线视频平台的流量洪峰，背后都离不开多线程技术的支持。在数字化转型的过程中，高并发、高性能是衡量系统性能的核心指标，越来越多的公司对从业人员的多线程编程能力提出了... [详细]
赞
踩
article
[ 云计算 | AWS 实践 ] Java 应用中使用 Amazon S3 进行存储桶和对象操作完全指南_s3使用 java
在本文中，我们将探索如何利用Java编程与AmazonS3（即简单存储服务）存储系统进行互动。需要牢记，S3的结构异常简单：每个存储桶能够容纳大量的对象，这些对象可以通过SOAP接口或REST风格的API进行访问。接下来，我们将使用适用于J... [详细]
赞
踩
article
Java LeetCode篇-深入了解关于单链表的经典解法
1.0移除链表元素、2.0反转链表、3.0链表中倒数第k个节点、4.0合并两个有序链表、5.0链表的回文结构、6.0环形链表、7.0相加链表JavaLeetCode篇-深入了解关于单链表的经典解法 ... [详细]
赞
踩
article
学生管理系统--课程设计项目（Java+SQL server）_java和sql server 2012 课程设计‘
因为项目不方便直接发上来，所以大家需要源码的话就私我叭~_java和sqlserver2012课程设计‘java和sqlserver2012课程设计‘本科参与项目文档合集:点击跳转~学生管理系统StudentManagementSystem... [详细]
赞
踩
article
[ 云计算 | AWS 实践 ] 使用 Java 检查指定的密钥是否存在于给定的 Amazon S3 存储桶中_java aws s3 文件是否存在
在本博文中，我们将探讨如何使用Java检查指定的秘钥是否存在于亚马逊S3存储桶中。AmazonS3是一个非常流行的云存储服务，为存储和检索数据提供了可伸缩、安全和高可用的平台。就个人而言，后续很多的公有云平台或者一些SaaS服务，都或多或少... [详细]
赞
踩
article
【JAVA】分布式链路追踪技术概论
进来！只花五分钟学懂！采用分布式架构时，一次请求报错难以定位，分布式链路追踪技术来解决。【JAVA】分布式链路追踪技术概论目录1.概述2.基于日志的实现2.1.实现思想2.2.sleuth2.2.可视化3.基于agent的实现4.联系作者1... [详细]
赞
踩
article
Java Web3J ：使用web3j调用自己的智能合约的方法（教程）
web3j是一个轻量级、高度模块化、响应式、类型安全的Java和Android类库提供丰富API，用于处理以太坊智能合约及与以太坊网络上的客户端(节点)进行集成。可以通过它进行以太坊区块链的开发，而无需为你的应用平台编写集成代码。web3j... [详细]
赞
踩
article
[ 云计算 | AWS 实践 ] Java 应用中使用 Amazon S3 进行存储桶和对象操作完全指南_亚马逊s3java
在本文中，我们将探索如何利用Java编程与AmazonS3（即简单存储服务）存储系统进行互动。需要牢记，S3的结构异常简单：每个存储桶能够容纳大量的对象，这些对象可以通过SOAP接口或REST风格的API进行访问。接下来，我们将使用适用于J... [详细]
赞
踩
article
java.net.NoRouteToHostException No route to host的排查与解决思路分享_caused by: java.net.noroutetohostexception: no rou
那问题肯定就出在这个datanode22中了，经过简单的测试发现，在HiveSQL的执行过程中，hadoop的心跳时间经常很大，整个hadoop集群的心跳超时时间设置为600S(这个值设置的非常大，其实是有点不合理的)，在web页面上能看见... [详细]
赞
踩
article
解决思路：java.lang.IllegalArgumentException: Invalid character found in method name. HTTP method names
然后，我们设置了请求方法为POST，并设置了请求头部信息，包括Content-Type和Accept。通过检查代码中的方法名、使用合适的HTTP请求方法常量、使用第三方HTTP库、检查请求URL以及使用调试和日志工具，我们可以解决这个异常并... [详细]
赞
踩
article
【Java SE】带你识别什么叫做异常！！！
Java中虽然已经内置了丰富的异常类,但是并不能完全表示实际开发中所遇到的一些异常，此时就需要维护符合我们实际情况的异常结构.if(!thrownewuserNameException("用户名错误");if(!thrownewpassWo... [详细]
赞
踩
article
Java 算法篇-深入理解递归（递归实现：青蛙爬楼梯）
假设第一个元素已经排序好了的，在已经排好的元素的后一个元素记录为low，这个low索引对应的元素需要用临时变量来接受，只要找到比这个索引对应的元素小的值，就可以插入到比它小的值的后一个索引位置了，当然，每一次对比之后，都需要往后移一个位置，... [详细]
赞
踩
article
【Java SE】类和对象（下）
在文件的最上方加上一个package语句指定该代码在哪个包中.包名需要尽量指定成唯一的名字,通常会用公司的域名的颠倒形式例如包名要和代码路径相匹配.例如创建的包,那么会存在一个对应的路径来存储代码.如果一个类没有package语句,则该类被... [详细]
赞
踩
article
【Java 基础篇】Java Set 详解
Set接口继承自Collection接口，并添加了一些针对无序集合的操作。它不允许重复的元素，并提供了添加、删除和检查元素是否存在的方法。在Java中，Set接口有几个常见的实现类，每个实现类都具有不同的性能和用途。HashSet：基于哈希... [详细]
赞
踩

Java实现CR-图片文字识别功能（超简单）

一.什么是OCR

二.Tesseract-OCR 的特点

三.使用案例

1.导入相关的依赖

2.导入中文字体库

3.编写测试类进行测试

java Web实现用户登录功能_javaweb写一个登录注册界面

[ 云计算 | AWS 实践 ] 使用 Java 检查指定的密钥是否存在于给定的 Amazon S3 存储桶中

[ 云计算 | AWS 实践 ] 使用 Java 更新现有 Amazon S3 对象

Java 算法篇-深入了解单链表的反转（实现：用 5 种方式来具体实现）

如何在 Java 中将 InputStream 读取/转换为字符串？_inputstream转字符串

猿创征文｜弃文从工，从小白到蚂蚁工程师，我的 Java 成长之路

【Java】你掌握了多线程吗？

[ 云计算 | AWS 实践 ] Java 应用中使用 Amazon S3 进行存储桶和对象操作完全指南_s3使用 java

Java LeetCode篇-深入了解关于单链表的经典解法

学生管理系统--课程设计项目（Java+SQL server）_java和sql server 2012 课程设计‘

[ 云计算 | AWS 实践 ] 使用 Java 检查指定的密钥是否存在于给定的 Amazon S3 存储桶中_java aws s3 文件是否存在

【JAVA】分布式链路追踪技术概论

Java Web3J ：使用web3j调用自己的智能合约的方法（教程）

[ 云计算 | AWS 实践 ] Java 应用中使用 Amazon S3 进行存储桶和对象操作完全指南_亚马逊s3java

java.net.NoRouteToHostException No route to host的排查与解决思路分享_caused by: java.net.noroutetohostexception: no rou

解决思路：java.lang.IllegalArgumentException: Invalid character found in method name. HTTP method names

【Java SE】带你识别什么叫做异常！！！

Java 算法篇-深入理解递归（递归实现：青蛙爬楼梯）

【Java SE】类和对象（下）

【Java 基础篇】Java Set 详解