赞
踩
百度找到官网链接:
点击控制台:
登录上去,没有百度账户的可以先注册:
点击产品服务,找到人工智能,然后点击文字识别(下面的图片是老版的智能云):
点击创建应用
随便填自己的想要的名字,应用类型也可以自己选一个:
自己填点内容进去,点击立即创建即可:
创建成功,这两个东西以后要用到的:
分两种方式:
第一是直接url调用api:
官方api链接:http://ai.baidu.com/docs#/OCR-API/top
下面是java实现方式,案例是表格文字识别
import java.io.BufferedReader; import java.io.DataOutputStream; import java.io.FileReader; import java.io.IOException; import java.io.InputStreamReader; import java.net.HttpURLConnection; import java.net.MalformedURLException; import java.net.URL; import java.net.URLEncoder; import java.util.Base64; import java.util.List; import java.util.Map; import org.json.JSONObject; import com.alibaba.fastjson.JSON; public class TestApi { public static void main(String[] args) throws Exception { /* String ss= "中国"; String s=Base64.getEncoder().encodeToString(ss.getBytes("gbk")); System.out.println(s); byte[] b = Base64.getDecoder().decode(s); System.out.println(new String(b,"gbk"));*/ //第一步,官方要求需要把图片转base64再转URLEncoder //获取图片base64编码 String image =getImageStr("D:\\360Rec\\183410564149088537.jpg"); String APIKey = "你的APIKey"; String SecretKey = "你的SecretKey"; //第二步, 通过API Key和Secret Key获取的access_token String access_token = getAuth(APIKey, SecretKey); System.out.println("access_token: " + access_token); //拼接请求体 String content = "access_token=" + URLEncoder.encode(access_token, "gbk") + "&image=" + URLEncoder.encode(image, "gbk"); //表格识别url String imageUrl= "https://aip.baidubce.com/rest/2.0/solution/v1/form_ocr/request"; //第三步,发送请求 String response = sendPost(imageUrl, content); //解析结果拿到request_id再次发送结果接口请求获取识别内容 String result = JSON.parseObject(response).get("result").toString(); String request_id = JSON.parseObject(result.substring(1,result.length()-1)).get("request_id").toString(); System.out.println("request_id: " + request_id); Thread.sleep(1000*10);//由于解析有延时,所以睡眠一下 //第四步,通过上面获取到的request_id去获取解析结果 //获取结果url String resultURL= "https://aip.baidubce.com/rest/2.0/solution/v1/form_ocr/get_request_result"; //拼接结果请求体 String requestData = "access_token=" + URLEncoder.encode(access_token, "gbk") + "&request_id=" + URLEncoder.encode(request_id, "gbk") + "&result_type=excel"; //发送结果请求 sendPost(resultURL,requestData); } /** * 解析图片转成base64编码 * @param imgFile * @return * @throws Exception */ public static String getImageStr(String imgFile) throws Exception { // 将图片文件转化为字节数组字符串,并对其进行Base64编码处理 //String imgFile = "d:\\111.jpg";// 待处理的图片 /* InputStream in = null; byte[] data = null; // 读取图片字节数组 try { in = new FileInputStream(imgFile); data = new byte[in.available()]; in.read(data); in.close(); } catch (IOException e) { e.printStackTrace(); }*/ StringBuffer buffer = new StringBuffer(); BufferedReader bf= new BufferedReader(new FileReader(imgFile)); String s = null; while((s = bf.readLine())!=null){//使用readLine方法,一次读一行 buffer.append(s.trim()); } String data = buffer.toString(); // 对字节数组Base64编码 // BASE64Encoder encoder = new BASE64Encoder(); // 返回Base64编码过的字节数组字符串 // return encoder.encode(data.getBytes("gbk")); return Base64.getEncoder().encodeToString(data.getBytes("gbk")); } /** * * @param u url地址 * @param param 跟在?后面的参数 * @return */ public static String sendPost(String u, String param) { StringBuffer sbf = new StringBuffer(); try { URL url = new URL(u); HttpURLConnection connection = (HttpURLConnection) url.openConnection(); connection.setDoInput(true); connection.setDoOutput(true); connection.setRequestMethod("POST"); connection.setUseCaches(false); connection.setInstanceFollowRedirects(true); // connection.addRequestProperty("role", "Admin"); connection.addRequestProperty("Content-Type", "application/x-www-form-urlencoded"); // connection.setRequestProperty("User-Agent", "Mozilla/4.0 (compatible; MSIE 5.0; Windows NT; DigExt)"); connection.connect(); DataOutputStream out = new DataOutputStream(connection.getOutputStream()); if (!"".equals(param)) { // 正文,正文内容其实跟get的URL中 '? '后的参数字符串一致 // String content = "字段名=" + URLEncoder.encode("字符串值", "编码"); out.writeBytes(param); } out.flush(); out.close(); BufferedReader reader = new BufferedReader(new InputStreamReader(connection.getInputStream())); String lines; while ((lines = reader.readLine()) != null) { lines = new String(lines.getBytes(), "utf-8"); sbf.append(lines); } System.out.println(sbf); reader.close(); // 断开连接 connection.disconnect(); } catch (MalformedURLException e) { // TODO Auto-generated catch block e.printStackTrace(); } catch (IOException e) { // TODO Auto-generated catch block e.printStackTrace(); } return sbf.toString(); } /** * 通过API Key和Secret Key获取的access_token * @param ak API Key * @param sk Secret Key * @return */ public static String getAuth(String ak, String sk) { // 获取token地址 String authHost = "https://aip.baidubce.com/oauth/2.0/token?"; String getAccessTokenUrl = authHost // 1. grant_type为固定参数 + "grant_type=client_credentials" // 2. 官网获取的 API Key + "&client_id=" + ak // 3. 官网获取的 Secret Key + "&client_secret=" + sk; try { URL realUrl = new URL(getAccessTokenUrl); // 打开和URL之间的连接 HttpURLConnection connection = (HttpURLConnection) realUrl.openConnection(); connection.setRequestMethod("GET"); connection.connect(); // 获取所有响应头字段 Map<String, List<String>> map = connection.getHeaderFields(); // 遍历所有的响应头字段 for (String key : map.keySet()) { System.err.println(key + "--->" + map.get(key)); } // 定义 BufferedReader输入流来读取URL的响应 BufferedReader in = new BufferedReader(new InputStreamReader(connection.getInputStream())); String result = ""; String line; while ((line = in.readLine()) != null) { result += line; } /** * 返回结果示例 */ System.out.println("result:" + result); JSONObject jsonObject = new JSONObject(result); String access_token = jsonObject.getString("access_token"); return access_token; } catch (Exception e) { System.err.printf("获取token失败!"); e.printStackTrace(System.err); } return null; } }
如果有错误可以参考官方的错误信息说明:
链接1:https://cloud.baidu.com/doc/IMAGERECOGNITION/ImageClassify-API/1B.5C.E9.94.99.E8.AF.AF.E7.A0.81.html
链接2:https://cloud.baidu.com/doc/NLP/NLP-Cpp-SDK/36.5C.E9.94.99.E8.AF.AF.E8.BF.94.E5.9B.9E.E6.A0.BC.E5.BC.8F.html
或者上官网社区找:http://ai.baidu.com/forum
第二种sdk方式调用
首先下载jar包,或者maven引入,下面是maven的方式,我用的版本是4.4.1的,下面的${aip.version}可以替换成这个版本号
官网学习链接参考:http://ai.baidu.com/docs#/OCR-Java-SDK/top
官网sdk下载地址:http://ai.baidu.com/sdk
<!--百度云api -->
<dependency>
<groupId>com.baidu.aip</groupId>
<artifactId>java-sdk</artifactId>
<version>${aip.version}</version>
</dependency>
下面是使用案例代码:
import java.util.HashMap; import org.json.JSONObject; import com.baidu.aip.ocr.AipOcr; public class TestAip { //设置APPID/AK/SK public static final String APP_ID = "你的APP_ID"; public static final String API_KEY = "你的API_KEY"; public static final String SECRET_KEY = "你的SECRET_KEY"; public static void main(String[] args) { // 初始化一个AipOcr AipOcr client = new AipOcr(APP_ID, API_KEY, SECRET_KEY); // 可选:设置网络连接参数 client.setConnectionTimeoutInMillis(2000); client.setSocketTimeoutInMillis(60000); // 可选:设置代理服务器地址, http和socket二选一,或者均不设置 // client.setHttpProxy("proxy_host", proxy_port); // 设置http代理 // client.setSocketProxy("proxy_host", proxy_port); // 设置socket代理 // 可选:设置log4j日志输出格式,若不设置,则使用默认配置 // 也可以直接通过jvm启动参数设置此环境变量 System.setProperty("aip.log4j.conf", "log4j.properties"); // 传入可选参数调用接口 HashMap<String, String> options = new HashMap<String, String>(); options.put("result_type", "json"); //解析结果拿到request_id再次发送结果接口请求获取识别内容 String result = JSON.parseObject(res.toString(2)).get("result").toString(); String request_id = JSON.parseObject(result.substring(1,result.length()-1)).get("request_id").toString(); System.out.println("request_id: " + request_id); //String requestId = "11253090_374367"; //睡眠10秒,由于上面请求后,图片解析需要一点时间,这里睡眠一会再去调用结果接口,不然会返回的状态ret_msg是未开始或者进行中 Thread.sleep(1000*10); // 表格识别结果 JSONObject ress = client.tableResultGet(request_id, options); System.out.println(ress.toString(2)); } }
运行结果:
同时可以参考另外两篇相关博文:
百度智能云api的使用(python)、SDK和API的区别是什么?
原文作者:Tlimited
原文链接:https://blog.csdn.net/u014204541/article/details/80944884
我本来是想找图片清晰化的方法,就搜到百度智能云了,不得不感叹云相关的技术发展的真快,真好!
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。