当前位置:   article > 正文

Android 百度文字识别(详细步骤+源码),2024年最新androidframework面试_android 百度文字识别api

android 百度文字识别api

先自我介绍一下,小编浙江大学毕业,去过华为、字节跳动等大厂,目前阿里P7

深知大多数程序员,想要提升技能,往往是自己摸索成长,但自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!

因此收集整理了一份《2024年最新Android移动开发全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友。
img
img
img
img
img
img
img

既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,涵盖了95%以上Android开发知识点,真正体系化!

由于文件比较多,这里只是将部分目录截图出来,全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频,并且后续会持续更新

如果你需要这些资料,可以添加V获取:vip204888 (备注Android)
img

正文

},

{

“words”:“你说你有点难追”

},

{

“words”:“我就打断你的腿CN”

}

],

“log_id”:1329724251397160960,

“words_result_num”:5,

“direction”:0

}

百度SDK文字识别

    • 一、创建平台应用
  • 二、创建及配置Android项目

  • 三、初始化

  • 四、UI模块导入

  • 五、UI模块使用

  • 六、高精度文字识别

  • 七、源码

一、创建平台应用


要使用百度文字识别,自然免不了要注册该平台的账号,否则凭什么让你使用,点击百度智能云进入,没有账号的可以先注册账号,注册应该就不用我讲解了吧?这里默认都有账号了,然后登录。

登录后 然后进入控制台,找到文字识别,然后点击。

在这里插入图片描述

可以看到这个文字识别SDK的使用场景,本文介绍的是通用场景,然后点击创建应用。

在这里插入图片描述

输入应用名称,指的是你在百度智能云上创建的文字识别应用。

在这里插入图片描述

向下滚动。填写相关资料之后,点击立即创建

在这里插入图片描述

创建完成之后,点击查看应用详情。

在这里插入图片描述

注意API KeySecret Key这两个值,而这个包名就是你项目的包名。

在这里插入图片描述

点击上方下载SDK

在这里插入图片描述

下载到本地,然后解压。

在这里插入图片描述

解压之后文件如下图所示,里面的文件在项目中是要用到的。

在这里插入图片描述

二、创建及配置Android项目


打开Android Studio,创建一个名为TextOCRDemo的项目,包名和你刚才的要一致。

在这里插入图片描述

然后打开目录

在这里插入图片描述

先将libs目录中的ocr-sdk.jar文件拷贝到工程libs目录中,并加入工程依赖。

在这里插入图片描述

然后出现

在这里插入图片描述

点击OK,等待添加完成,然后打开你的app下的build.gradle中,你会发现多一句依赖。

在这里插入图片描述

然后在main下创建一个jniLibs文件夹。将libs目录下armeabi,arm64-v8a,armeabi-v7a,x86文件夹添加到工程src/main/jniLibs目录中,如下图所示

在这里插入图片描述

创建好之后打开AndroidManifest.xml,注册一些需要用到的权限。

三、初始化


然后进入到MainActivity中进行SDK的初始化。

/**

  • 对应百度平台上的应用apiKey

*/

private String apiKey = “gQm5vnWxGuz5khN4IZ16yriL”;

/**

  • 对应百度平台上的应用secretKey

*/

private String secretKey = “c8t796hbq0DXdsngSsOou5FCK2fFckpn”;

@Override

protected void onCreate(Bundle savedInstanceState) {

super.onCreate(savedInstanceState);

setContentView(R.layout.activity_main);

initTextSDK();

}

/**

  • 用明文ak,sk初始化

*/

private void initTextSDK() {

OCR.getInstance(this).initAccessTokenWithAkSk(new OnResultListener() {

@Override

public void onResult(AccessToken result) {

String token = result.getAccessToken();

Log.d(“result–>”,“成功!”+token);

}

@Override

public void onError(OCRError error) {

error.printStackTrace();

Log.d(“result–>”,“失败!”+error.getMessage());

}

}, getApplicationContext(), apiKey, secretKey);

}

运行之后打印日志

在这里插入图片描述

四、UI模块导入


File → New → Import Module…

在这里插入图片描述

ocr_ui就是之前解压之后的一个文件,你可以放在一个好找的位置。

在这里插入图片描述

点击Finish,导入

在这里插入图片描述

然后发现报错了,模块中的gradle与app中的不一致。

在这里插入图片描述

点击Remove Build Tools version and sync project,删除构建项目并同步版本。

在这里插入图片描述

点击Do Refactor,发现还有报错。打开ocr_ui模块的build.gradle

在这里插入图片描述

修改如下,然后Sync

dependencies {

androidTestImplementation(‘com.android.support.test.espresso:espresso-core:2.2.2’, {

exclude group: ‘com.android.support’, module: ‘support-annotations’

})

implementation ‘com.android.support:appcompat-v7:25.1.1’

testImplementation ‘junit:junit:4.12’

implementation files(‘libs/license.jar’)

}

现在就不报错了。为了确保导入的模块不会影响到之前的项目,现在称还没有用之前,先运行一下,运行到真机上,没有问题的话就说明这个模块导入正常,可以使用了。

五、UI模块使用


使用其他的模块也是需要添加依赖的,打开app的build.gradle,

implementation project(path: ‘:ocr_ui’)

在这里插入图片描述

然后Sync,完成后。你就可以在app中使用ocr_ui中的方法了。

首先修改activity_main.xml,这里只放了一个按钮

<?xml version="1.0" encoding="utf-8"?>

<LinearLayout xmlns:android=“http://schemas.android.com/apk/res/android”

xmlns:app=“http://schemas.android.com/apk/res-auto”

xmlns:tools=“http://schemas.android.com/tools”

android:layout_width=“match_parent”

android:layout_height=“match_parent”

android:orientation=“vertical”

tools:context=“.MainActivity”>

<Button

android:id=“@+id/general_basic_button”

android:layout_width=“match_parent”

android:layout_height=“wrap_content”

android:onClick=“generalBasic”

android:text=“通用文字识别” />

然后在MainActivity中创建一个generalBasic方法。如下:

/**

  • 通用文字识别

  • @param view

*/

public void generalBasic(View view) {

}

然后创建一个成员变量

/**

  • 通用文字识别请求码

*/

private static final int REQUEST_CODE_GENERAL_BASIC = 100;

创建获取保存文件的方法和Toast提示的方法

/**

  • Toast提示

  • @param msg

*/

private void showMsg(String msg) {

Toast.makeText(this,msg,Toast.LENGTH_SHORT).show();

}

/**

  • 获取保存文件

  • @param context

  • @return

*/

public static File getSaveFile(Context context) {

File file = new File(context.getFilesDir(), “pic.jpg”);

return file;

}

点击按钮时调用generalBasic

/**

  • 通用文字识别

  • @param view

*/

public void generalBasic(View view) {

Intent intent = new Intent(MainActivity.this, CameraActivity.class);

//传入文件保存的路径

intent.putExtra(CameraActivity.KEY_OUTPUT_FILE_PATH, getSaveFile(getApplication()).getAbsolutePath());

//传入文件类型

intent.putExtra(CameraActivity.KEY_CONTENT_TYPE, CameraActivity.CONTENT_TYPE_GENERAL);

//跳转页面时传递请求码,返回时根据请求码判断获取识别的数据。

startActivityForResult(intent, REQUEST_CODE_GENERAL_BASIC);

}

在com.llw.textocr包下新建一个RecognizeService类

代码如下

/*

  • Copyright © 2017 Baidu, Inc. All Rights Reserved.

*/

package com.llw.textocr;

import android.content.Context;

import com.baidu.ocr.sdk.OCR;

import com.baidu.ocr.sdk.OnResultListener;

import com.baidu.ocr.sdk.exception.OCRError;

import com.baidu.ocr.sdk.model.BankCardParams;

import com.baidu.ocr.sdk.model.BankCardResult;

import com.baidu.ocr.sdk.model.GeneralBasicParams;

import com.baidu.ocr.sdk.model.GeneralParams;

import com.baidu.ocr.sdk.model.GeneralResult;

import com.baidu.ocr.sdk.model.OcrRequestParams;

import com.baidu.ocr.sdk.model.OcrResponseResult;

import com.baidu.ocr.sdk.model.Word;

import com.baidu.ocr.sdk.model.WordSimple;

import java.io.File;

/**

  • Created by ruanshimin on 2017/4/20.

*/

public class RecognizeService {

interface ServiceListener {

public void onResult(String result);

}

public static void recGeneral(Context ctx, String filePath, final ServiceListener listener) {

GeneralParams param = new GeneralParams();

param.setDetectDirection(true);

param.setVertexesLocation(true);

param.setRecognizeGranularity(GeneralParams.GRANULARITY_SMALL);

param.setImageFile(new File(filePath));

OCR.getInstance(ctx).recognizeGeneral(param, new OnResultListener() {

@Override

public void onResult(GeneralResult result) {

StringBuilder sb = new StringBuilder();

for (WordSimple wordSimple : result.getWordList()) {

Word word = (Word) wordSimple;

sb.append(word.getWords());

sb.append(“\n”);

}

listener.onResult(result.getJsonRes());

}

@Override

public void onError(OCRError error) {

listener.onResult(error.getMessage());

}

});

}

public static void recAccurate(Context ctx, String filePath, final ServiceListener listener) {

GeneralParams param = new GeneralParams();

param.setDetectDirection(true);

param.setVertexesLocation(true);

param.setRecognizeGranularity(GeneralParams.GRANULARITY_SMALL);

param.setImageFile(new File(filePath));

OCR.getInstance(ctx).recognizeAccurate(param, new OnResultListener() {

@Override

public void onResult(GeneralResult result) {

StringBuilder sb = new StringBuilder();

for (WordSimple wordSimple : result.getWordList()) {

Word word = (Word) wordSimple;

sb.append(word.getWords());

sb.append(“\n”);

}

listener.onResult(result.getJsonRes());

}

@Override

public void onError(OCRError error) {

listener.onResult(error.getMessage());

}

});

}

public static void recAccurateBasic(Context ctx, String filePath, final ServiceListener listener) {

GeneralParams param = new GeneralParams();

param.setDetectDirection(true);

param.setVertexesLocation(true);

param.setRecognizeGranularity(GeneralParams.GRANULARITY_SMALL);

param.setImageFile(new File(filePath));

OCR.getInstance(ctx).recognizeAccurateBasic(param, new OnResultListener() {

@Override

public void onResult(GeneralResult result) {

StringBuilder sb = new StringBuilder();

for (WordSimple wordSimple : result.getWordList()) {

WordSimple word = wordSimple;

sb.append(word.getWords());

sb.append(“\n”);

}

listener.onResult(result.getJsonRes());

}

@Override

public void onError(OCRError error) {

listener.onResult(error.getMessage());

}

});

}

public static void recGeneralBasic(Context ctx, String filePath, final ServiceListener listener) {

GeneralBasicParams param = new GeneralBasicParams();

param.setDetectDirection(true);

param.setImageFile(new File(filePath));

OCR.getInstance(ctx).recognizeGeneralBasic(param, new OnResultListener() {

@Override

public void onResult(GeneralResult result) {

StringBuilder sb = new StringBuilder();

for (WordSimple wordSimple : result.getWordList()) {

WordSimple word = wordSimple;

sb.append(word.getWords());

sb.append(“\n”);

}

listener.onResult(result.getJsonRes());

}

@Override

public void onError(OCRError error) {

listener.onResult(error.getMessage());

}

});

}

public static void recGeneralEnhanced(Context ctx, String filePath, final ServiceListener listener) {

GeneralBasicParams param = new GeneralBasicParams();

param.setDetectDirection(true);

param.setImageFile(new File(filePath));

OCR.getInstance(ctx).recognizeGeneralEnhanced(param, new OnResultListener() {

@Override

public void onResult(GeneralResult result) {

StringBuilder sb = new StringBuilder();

for (WordSimple wordSimple : result.getWordList()) {

WordSimple word = wordSimple;

sb.append(word.getWords());

sb.append(“\n”);

}

listener.onResult(result.getJsonRes());

}

@Override

public void onError(OCRError error) {

listener.onResult(error.getMessage());

}

});

}

public static void recWebimage(Context ctx, String filePath, final ServiceListener listener) {

GeneralBasicParams param = new GeneralBasicParams();

param.setDetectDirection(true);

param.setImageFile(new File(filePath));

OCR.getInstance(ctx).recognizeWebimage(param, new OnResultListener() {

@Override

public void onResult(GeneralResult result) {

StringBuilder sb = new StringBuilder();

for (WordSimple wordSimple : result.getWordList()) {

WordSimple word = wordSimple;

sb.append(word.getWords());

sb.append(“\n”);

}

listener.onResult(result.getJsonRes());

}

@Override

public void onError(OCRError error) {

listener.onResult(error.getMessage());

}

});

}

public static void recBankCard(Context ctx, String filePath, final ServiceListener listener) {

BankCardParams param = new BankCardParams();

param.setImageFile(new File(filePath));

OCR.getInstance(ctx).recognizeBankCard(param, new OnResultListener() {

@Override

public void onResult(BankCardResult result) {

String res = String.format(“卡号:%s\n类型:%s\n发卡行:%s”,

result.getBankCardNumber(),

result.getBankCardType().name(),

result.getBankName());

listener.onResult(res);

}

@Override

public void onError(OCRError error) {

listener.onResult(error.getMessage());

}

});

}

public static void recVehicleLicense(Context ctx, String filePath, final ServiceListener listener) {

OcrRequestParams param = new OcrRequestParams();

param.setImageFile(new File(filePath));

OCR.getInstance(ctx).recognizeVehicleLicense(param, new OnResultListener() {

@Override

public void onResult(OcrResponseResult result) {

listener.onResult(result.getJsonRes());

}

@Override

public void onError(OCRError error) {

listener.onResult(error.getMessage());

}

});

}

public static void recDrivingLicense(Context ctx, String filePath, final ServiceListener listener) {

OcrRequestParams param = new OcrRequestParams();

param.setImageFile(new File(filePath));

OCR.getInstance(ctx).recognizeDrivingLicense(param, new OnResultListener() {

@Override

public void onResult(OcrResponseResult result) {

listener.onResult(result.getJsonRes());

}

@Override

public void onError(OCRError error) {

listener.onResult(error.getMessage());

}

});

}

public static void recLicensePlate(Context ctx, String filePath, final ServiceListener listener) {

OcrRequestParams param = new OcrRequestParams();

param.setImageFile(new File(filePath));

OCR.getInstance(ctx).recognizeLicensePlate(param, new OnResultListener() {

@Override

public void onResult(OcrResponseResult result) {

listener.onResult(result.getJsonRes());

}

@Override

public void onError(OCRError error) {

listener.onResult(error.getMessage());

}

});

}

public static void recBusinessLicense(Context ctx, String filePath, final ServiceListener listener) {

OcrRequestParams param = new OcrRequestParams();

param.setImageFile(new File(filePath));

OCR.getInstance(ctx).recognizeBusinessLicense(param, new OnResultListener() {

@Override

public void onResult(OcrResponseResult result) {

listener.onResult(result.getJsonRes());

}

@Override

public void onError(OCRError error) {

最后送福利了,现在关注我可以获取包含源码解析,自定义View,动画实现,架构分享等。
内容难度适中,篇幅精炼,每天只需花上十几分钟阅读即可。
大家可以跟我一起探讨,有flutter—底层开发—性能优化—移动架构—资深UI工程师 —NDK相关专业人员和视频教学资料,还有更多面试题等你来拿

录播视频图.png

网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。

需要这份系统化的资料的朋友,可以添加V获取:vip204888 (备注Android)
img

一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!

nRes());

}

@Override

public void onError(OCRError error) {

listener.onResult(error.getMessage());

}

});

}

public static void recBusinessLicense(Context ctx, String filePath, final ServiceListener listener) {

OcrRequestParams param = new OcrRequestParams();

param.setImageFile(new File(filePath));

OCR.getInstance(ctx).recognizeBusinessLicense(param, new OnResultListener() {

@Override

public void onResult(OcrResponseResult result) {

listener.onResult(result.getJsonRes());

}

@Override

public void onError(OCRError error) {

最后送福利了,现在关注我可以获取包含源码解析,自定义View,动画实现,架构分享等。
内容难度适中,篇幅精炼,每天只需花上十几分钟阅读即可。
大家可以跟我一起探讨,有flutter—底层开发—性能优化—移动架构—资深UI工程师 —NDK相关专业人员和视频教学资料,还有更多面试题等你来拿

[外链图片转存中…(img-SvIQISNx-1713682772575)]

网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。

需要这份系统化的资料的朋友,可以添加V获取:vip204888 (备注Android)
[外链图片转存中…(img-AdN4DXrq-1713682772575)]

一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/我家自动化/article/detail/684132
推荐阅读
相关标签
  

闽ICP备14008679号