当前位置:   article > 正文

C# 调用百度AI接口实现文字识别

c#词法分析百度接口

今天心血来潮做了个识别图片文字的demo,现在文字识别技术已经比较成熟了,而且还有可以调用的公共接口。

今天做的demo主要简单对比了Tesseract-OCR和BAIDU.AI 这两种方法,感觉百度的中文识别准确率更高,Tesseract-OCR中文别准确率较差,需要自己训练词库,这个比较麻烦。所以demo主要介绍调用百度AI接口实现文字提取。

那就开始吧。

首先,你得去官网(https://ai.baidu.com/)申请调用所需要的AppID以及API Key,这是调用凭证。

6b551895c7622b99bb915f0913d76b9c.png

创建你的应用,按需填写(随便填就行),提交后系统会给你生成所需要的调用凭证。

77572849769a726a8e1ed73e6a42b7d8.png

 之后就是创建Demo项目了,这里就不再赘述了,现在做的demo是winform项目。项目新建好了就可以增加接口的SKD了,在项目-->管理Nuget程序包,在浏览页上搜索 baidu.ai,安装这个

cb12659f24165636f1bc4d1ae43146fd.png

安装完后,你会发现在项目的引用下已经引用了 AipSdk  这个dll。

新建一个窗体吧,并加入些需要的控件 

cd542c0c20973b4dd62ec660493707b1.png

 我们通过【选择图片】来选择要识别的图片,然后点击【提取】按钮,识别图片上的文字。

首先附上【选择图片】按钮的代码:

dfd33e76fee9d35b9c69aaba3edb1c06.png

就是这么简单,这时会把图片的完整路径放在一个textbox里,接下来看看【提取】功能的实现,识别到的结果会保存在richTextBox里。

17b6e8c46ba754b5d1f0a94cb8d33231.png

 5591438e6c307e9767b7ec0b126c56e2.png

 就是这么简单了。其实别看我们调用接口实现功能这么简单,识别文字的接口开发可不是这么简单。程序跑起来看看效果吧。

240d05c47a84c350670ff3a6bc379833.png

 摄像机拍摄的图片,识别出来了,完美。再手写体看看

078803219f4feca52d317134014e3bb9.png

写好点还是可以识别出来的 

1b792535002e0b5f53a15daaef5daf0d.png

6de52a4dbfed901bcfa13a9dd4421d63.png

这种写得潦草一点的通用文字识别接口(ocr.GeneralBasic(bt, ops) 就是这个方法)可能就会识别不准确了,还是要训练字库。 

对于识别不出来或是识别不准确的可以试一下高精度的接口方法(就是把上面的方法ocr.GeneralBasic(bt, ops) 换成ocr.AccurateBasic(bt,ops)),API上说提供了好几种方法,根据需要调用不同的方法吧。

d04e1088534f68e64a5ef5b7c621a753.png

各种证件图片都是可以识别出来的,大家可以试试就不一一贴图了。

代码:

  1. using Baidu.Aip.Ocr;
  2. using Newtonsoft.Json.Linq;
  3. using System;
  4. using System.Collections.Generic;
  5. using System.ComponentModel;
  6. using System.Drawing;
  7. using System.IO;
  8. using System.Windows.Forms;
  9. namespace WindowsFormsApp20
  10. {
  11. public partial class Form1 : Form
  12. {
  13. public Form1()
  14. {
  15. InitializeComponent();
  16. }
  17. private void button1_Click(object sender, EventArgs e)
  18. {
  19. try
  20. {
  21. OpenFileDialog of = new OpenFileDialog();
  22. of.Filter = "图片(*.png;*.jpg;*.bmp;*.jpeg)|*.png;*.jpg;*.bmp;*.jpeg";
  23. if (of.ShowDialog() == DialogResult.OK)
  24. {
  25. richTextBox1.Text = of.FileName;
  26. }
  27. }
  28. catch (Exception ex)
  29. {
  30. MessageBox.Show("选择图片出错", "Error", MessageBoxButtons.OK, MessageBoxIcon.Error);
  31. }
  32. }
  33. private void openFileDialog1_FileOk(object sender, CancelEventArgs e)
  34. {
  35. }
  36. private void button2_Click(object sender, EventArgs e)
  37. {
  38. try
  39. {
  40. richTextBox2.Text = string.Empty;
  41. var imagePath = richTextBox1.Text;
  42. if (string.IsNullOrEmpty(imagePath))
  43. {
  44. MessageBox.Show("请选择图片文件", "Error", MessageBoxButtons.OK, MessageBoxIcon.Error);
  45. return;
  46. }
  47. Stream s = File.Open(imagePath, FileMode.Open);
  48. pictureBox1.Image = Image.FromStream(s);
  49. s.Close();
  50. s.Dispose();
  51. var apiKey = "你申请的Key";
  52. var apiSecretKey = "你申请的SecretKey";
  53. Ocr ocr = new Ocr(apiKey, apiSecretKey)
  54. {
  55. Timeout = 6000
  56. };
  57. byte[] bt = File.ReadAllBytes(imagePath);
  58. #region 参数可空,全部默认也行
  59. Dictionary<string, object> ops = new Dictionary<string, object>();
  60. ops.Add("language_type", "CHN_ENG");//识别语言类型,默认为CHN_ENG
  61. ops.Add("paragraph", true);//是否输出段落信息
  62. #endregion
  63. JObject jobject = ocr.GeneralBasic(bt,ops);//返回值是json类型
  64. if(jobject.Count > 0)
  65. {
  66. JArray jo = (JArray)jobject["words_result"];
  67. if(jo.Count > 0)
  68. {
  69. for(int i=0;i<jo.Count;i++)
  70. {
  71. richTextBox2.Text += jo[i]["words"].ToString() + Environment.NewLine;
  72. }
  73. }
  74. }
  75. }
  76. catch(Exception ex)
  77. {
  78. MessageBox.Show(ex.Message,"error",MessageBoxButtons.OK,MessageBoxIcon.Error);
  79. }
  80. }
  81. }
  82. }
声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:【wpsshop博客】
推荐阅读
相关标签
  

闽ICP备14008679号