当前位置:   article > 正文

从头学习opencv(12)--模板匹配_opencv shift

opencv shift

模板匹配

参考:https://www.cnblogs.com/FHC1994/p/9123393.html
模板匹配是一种最原始、最基本的模式识别方法,研究某一特定对象物的图案位于图像的什么地方,进而识别对象物,这就是一个匹配问题。它是图像处理中最基本、最常用的匹配方法。模板匹配具有自身的局限性,主要表现在它只能进行平行移动,若原图像中的匹配目标发生旋转或大小变化,该算法无效。

简单来说,模板匹配就是在整个图像区域发现与给定子图像匹配的小块区域。

工作原理:在带检测图像上,从左到右,从上向下计算模板图像与重叠子图像的匹配度,匹配程度越大,两者相同的可能性越大。

模板匹配算法
在这里插入图片描述
其中,

①TM_SQDIFF是平方差匹配;TM_SQDIFF_NORMED是标准平方差匹配。利用平方差来进行匹配,最好匹配为0.匹配越差,匹配值越大。

②TM_CCORR是相关性匹配;TM_CCORR_NORMED是标准相关性匹配。采用模板和图像间的乘法操作,数越大表示匹配程度较高, 0表示最坏的匹配效果。

③TM_CCOEFF是相关性系数匹配;TM_CCOEFF_NORMED是标准相关性系数匹配。将模版对其均值的相对值与图像对其均值的相关值进行匹配,1表示完美匹配,-1表示糟糕的匹配,0表示没有任何相关性(随机序列)。

总结:随着从简单的测量(平方差)到更复杂的测量(相关系数),我们可获得越来越准确的匹配(同时也意味着越来越大的计算代价)。

代码

def template_demo():
    tpl=cv.imread("D:/OpenCV/opencv/sources/samples/data/tpl.png")
    target=cv.imread("D:/OpenCV/opencv/sources/samples/data/lena.jpg")
    cv.imshow("template image",tpl)
    cv.imshow("target",target)
    methods=[cv.TM_SQDIFF_NORMED,cv.TM_CCORR_NORMED,cv.TM_CCOEFF_NORMED]
    th,tw=tpl.shape[:2]
    for md in methods:
        print(md)
        result=cv.matchTemplate(target,tpl,md)
        min_val,max_val,min_loc,max_loc=cv.minMaxLoc(result)
        if md==cv.TM_SQDIFF_NORMED:
            tl=min_loc
        else:
            tl=max_loc
        br=(tl[0]+tw,tl[1]+th)
        cv.rectangle(target,tl,br,(0,0,255),2)
        cv.imshow("match-"+np.str(md),target)
        #cv.imshow("match-"+np.str(md),result)
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19

完整代码

import cv2 as cv
import numpy as np

def template_demo():
    tpl=cv.imread("D:/OpenCV/opencv/sources/samples/data/tpl.png")
    target=cv.imread("D:/OpenCV/opencv/sources/samples/data/lena.jpg")
    cv.imshow("template image",tpl)
    cv.imshow("target",target)
    methods=[cv.TM_SQDIFF_NORMED,cv.TM_CCORR_NORMED,cv.TM_CCOEFF_NORMED]
    th,tw=tpl.shape[:2]
    tth,ttw=target.shape[:2]
    #print("tth=",tth)
    #print("ttw=",ttw)
    for md in methods:
        print(md)
        result=cv.matchTemplate(target,tpl,md)
        min_val,max_val,min_loc,max_loc=cv.minMaxLoc(result)
        if md==cv.TM_SQDIFF_NORMED:
            tl=min_loc
            #print("min_val=", min_val)
            #print("min_loc=", min_loc)
        else:
            tl=max_loc
            #print("max_val=", max_val)
            #print("max_loc=", max_loc)
        br=(tl[0]+tw,tl[1]+th)
        #print("tl[0]=",tl[0])
        #print("tl[1]=", tl[1])
        cv.rectangle(target,tl,br,(0,0,255),2)
        cv.imshow("match-"+np.str(md),target)
        #cv.imshow("match-"+np.str(md),result)


src = cv.imread("D:/OpenCV/opencv/sources/samples/data/demo.png")
cv.namedWindow("input image", cv.WINDOW_AUTOSIZE)
cv.imshow("input image", src)
template_demo()
cv.waitKey(0)
cv.destroyAllWindows()
print("Hi,python!")
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
  • 32
  • 33
  • 34
  • 35
  • 36
  • 37
  • 38
  • 39
  • 40

运行结果
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

函数补充说明

1.opencv的目标匹配函数为matchTemplate,函数原型为:matchTemplate(image, templ, method[, result[, mask]]) -> result

image参数表示待搜索源图像,必须是8位整数或32位浮点。

templ参数表示模板图像,必须不大于源图像并具有相同的数据类型。

method参数表示计算匹配程度的方法。

result参数表示匹配结果图像,必须是单通道32位浮点。如果image的尺寸为W x H,templ的尺寸为w x h,则result的尺寸为(W-w+1)x(H-h+1)。

2.opencv的函数minMaxLoc:在给定的矩阵中寻找最大和最小值,并给出它们的位置。 该功能不适用于多通道阵列。 如果您需要在所有通道中查找最小或最大元素,要先将阵列重新解释为单通道。

函数minMaxLoc原型为:minMaxLoc(src[, mask]) -> minVal, maxVal, minLoc, maxLoc

src参数表示输入单通道图像。

mask参数表示用于选择子数组的可选掩码。

minVal参数表示返回的最小值,如果不需要,则使用NULL。

maxVal参数表示返回的最大值,如果不需要,则使用NULL。

minLoc参数表示返回的最小位置的指针(在2D情况下); 如果不需要,则使用NULL。

maxLoc参数表示返回的最大位置的指针(在2D情况下); 如果不需要,则使用NULL。

参考:https://blog.csdn.net/liuqz2009/article/details/60869427

3.opencv的函数rectangle用于绘制矩形。函数原型为: rectangle(img, pt1, pt2, color[, thickness[, lineType[, shift]]]) -> img

img参数表示源图像。

pt1参数表示矩形的一个顶点。

pt2参数表示与pt1相对的对角线上的另一个顶点 。

color参数表示矩形线条颜色 (RGB) 或亮度(灰度图像 )。

thickness参数表示组成矩形的线条的粗细程度。取负值时(如 CV_FILLED)函数绘制填充了色彩的矩形。

lineType参数表示线条的类型。

shift参数表示坐标点的小数点位数。

代码补充说明

感觉对这个代码还不是很理解,所以研究了一下,如果发现想的有问题的地方就再改

methods=[cv.TM_SQDIFF_NORMED,cv.TM_CCORR_NORMED,cv.TM_CCOEFF_NORMED]
    th,tw=tpl.shape[:2]
    #tth,ttw=target.shape[:2]
    #print("tth=",tth)
    #print("ttw=",ttw)
    for md in methods:
        print(md)
        result=cv.matchTemplate(target,tpl,md)
        min_val,max_val,min_loc,max_loc=cv.minMaxLoc(result)
        if md==cv.TM_SQDIFF_NORMED:
            tl=min_loc
            #print("min_val=", min_val)
            #print("min_loc=", min_loc)
        else:
            tl=max_loc
            #print("max_val=", max_val)
            #print("max_loc=", max_loc)
        br=(tl[0]+tw,tl[1]+th)
        #print("tl[0]=",tl[0])
        #print("tl[1]=", tl[1])
        cv.rectangle(target,tl,br,(0,0,255),2)
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21

加上打印以后的输出结果

tth= 512
ttw= 512
1
min_val= 1.9534813588961697e-07
min_loc= (246, 251)
tl[0]= 246
tl[1]= 251
3
max_val= 0.9721378684043884
max_loc= (246, 251)
tl[0]= 246
tl[1]= 251
5
max_val= 0.7990837693214417
max_loc= (246, 251)
tl[0]= 246
tl[1]= 251
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17

这个部分,显示定义了匹配的方法,然后知道了tpl的宽和高,然后开始循环每一种方法进行匹配。根据cv.minMaxLoc函数输出四个值, min_val,max_val,min_loc,max_loc。这四个值,min_val是匹配的最小值,max_val是匹配的最大值,min_loc是最小值对应的指针位置,因为是在2d中,所以其实就是宽和高,max_loc是最大值对应的指针的位置。接下来进入if判断。if md==cv.TM_SQDIFF_NORMED则 tl=min_loc,是因为TM_SQDIFF_NORMED是平方差匹配,值越小说明匹配度越高。而TM_CCORR_NORMED是相关性匹配,值越大说明越匹配,TM_CCOEFF_NORMED是相关系数匹配,值越接近1越匹配。br=(tl[0]+tw,tl[1]+th),所以br[0]就是矩形右下角的宽,br[1]就是高。然后用函数画矩形。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/我家自动化/article/detail/79096
推荐阅读
相关标签
  

闽ICP备14008679号