当前位置:   article > 正文

go+orc文字识别_go 调用ocr

go 调用ocr

本文识别的是tiff 文件中的文字```

package main

import (
	"fmt"
	"github.com/chai2010/tiff"
	"github.com/otiai10/gosseract/v2"
	"gocv.io/x/gocv"
	"image"
	"os"
)

func main() {
	file, err := os.Open("1.tif")
	if err != nil {
		fmt.Println(err)
		return
	}
	defer file.Close()
	img, _ := tiff.Decode(file)
	bounds := img.Bounds()
	width := bounds.Dx()
	height := bounds.Dy()
	// 指定区域的坐标
	box := image.Rect(0, 0, width, height/10*2)
	text := recognizeText("1.tif", box)
	fmt.Println(text)
}

func recognizeText(imagePath string, box image.Rectangle) string {
	// 读取图片
	img := gocv.IMRead(imagePath, gocv.IMReadColor)

	// 裁剪指定区域的图片
	roiImg := img.Region(box)

	// 将裁剪后的图片转换为灰度图像
	grayImg := gocv.NewMat()
	gocv.CvtColor(roiImg, &grayImg, gocv.ColorBGRToGray)

	// 将gocv的Mat格式转换为字节数组
	imgBytes, _ := gocv.IMEncode(".png", grayImg)
	// 识别文字
	client := gosseract.NewClient()
	defer client.Close()
	client.SetLanguage("chi_sim")
	client.SetImageFromBytes(imgBytes.GetBytes())
	text, _ := client.Text()
	// 返回识别到的文字
	return text
}

  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
  • 32
  • 33
  • 34
  • 35
  • 36
  • 37
  • 38
  • 39
  • 40
  • 41
  • 42
  • 43
  • 44
  • 45
  • 46
  • 47
  • 48
  • 49
  • 50
  • 51

  • 1
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小丑西瓜9/article/detail/673745
推荐阅读
相关标签
  

闽ICP备14008679号