- 基础知识铺垫
今天的 1 个小时,我们要交给模板匹配了,而且学习起来比较轻松,因为我看到一句话,模板匹配是最没用的匹配方式,应用场景很少。
就喜欢这样的技术,学起来的摩擦力小,不容易掉头发。
模板匹配
模板匹配大意就是在整个图像区域寻找已有的小图像,在寻找之前,你需要准备一个待寻找的图像,以及一个小图
寻找的形式是从左到右,从上到下,这个找法很形象了,一行一行的找。
在寻找的过程中,通过 OpenCV 封装好的算法,计算小图与大图的匹配度,这个匹配度越大,两张图片相同的可能性越大。
模板匹配函数原型
在 Python 中,通过 help 函数,可以查看任意函数的说明。
matchTemplate(image, templ, method[, result[, mask]]) -> result
参数说明如下:
- :待检索的图像;
- :小图,要求不大于待搜索图像;
- :匹配方法,下表提供,算法不需要掌握,知道用法即可;
- :结果图像;
- :掩膜,需要与有相同的数据类型和大小,默认不设置,仅支持参数值为和
关于参数的值有以下几种情况:
- :平方差匹配;
- :标准平方差匹配,利用平方差来进行匹配,最好匹配为 0,匹配越差,匹配值越大;
- :相关性匹配;
- :标准相关性匹配,采用模板和图像间的乘法操作,数越大表示匹配程度较高, 0 表示最坏的匹配效果;
- :相关性系数匹配;
- :标准相关性系数匹配,将模版对其均值的相对值与图像对其均值的相关值进行匹配,1 表示完美匹配,-1 表示糟糕的匹配,0 表示没有任何相关性(随机序列)。
以上内容整理自网络
接下来编写测试代码:
import cv2 as cv# 读取目标图片,小图target = cv.imread("./target.jpg")# 读取模板图片,待查找的图片template = cv.imread("./template.jpg")# 获取模板图片的宽高尺寸,用于后面画矩形框th, tw = template.shape[:2]# 执行匹配模板,匹配方式选择标准平方差匹配result = cv.matchTemplate(target, template, cv.TM_SQDIFF_NORMED)# 输出匹配结果print(type(result))cv.imshow("image", result)cv.waitKey()
注意下图中,最终匹配到的区域颜色最深。
下面我们将其标记出来,需要用到一个新的函数,具体如下。
minMaxLoc 函数
该函数是在给定的矩阵中寻找最大值和最小值,并给出它们的位置。
特别说明是如果需要在所有的通道中查找最小或者最大元素,要先将矩阵重新解释为单通道,好吧,引出归一化的概念了。
那我们先把这个函数学到收,之后在把归一化的函数补充上。
函数原型如下:
minMaxLoc(src[, mask]) -> minVal, maxVal, minLoc, maxLoc
原型比较简单,输入一个图像之后,可以返回 4 个值。
这 4 个值分别是,最大值,最小值以及最大值与最小值的位置。
上文我们使用的是方法,按照上面的叙述,匹配值最小越好,所以需要获取一下图像的最小值位置。
修改上文代码如下:
import cv2 as cv# 读取目标图片,小图target = cv.imread("./target.jpg")# cv.imshow("target", target)# 读取模板图片,待查找的图片template = cv.imread("./template.jpg")# cv.imshow("template", template)# 获取模板图片的宽高尺寸,用于后面画矩形框th, tw = template.shape[:2]# 执行匹配模板,匹配方式选择标准平方差匹配result = cv.matchTemplate(target, template, cv.TM_SQDIFF_NORMED)# 获取最小值位置min_val, max_val, min_loc, max_loc = cv.minMaxLoc(result)tl = min_locprint(tl)# 通过模板的宽和高,找到匹配最好的右下角地方# tl[0],tl[1]分别代表最佳匹配值地方的 x 和 ybr = (tl[0]+tw, tl[1]+th)cv.rectangle(target, tl, br, (0,0,255),2)# 输出匹配结果cv.imshow("image", target)cv.waitKey()
最终运行效果如下,匹配成功。
其他的你自行测试吧。
补一个 cv2.normalize
学习新的函数,先把概念通读,尝试理解,理解不要在降格到应用。
归一化就是把待处理的数据进行处理,这里的处理就是某种算法了,然后将数据限制在一个范围内(范围由我们自己定义)
归一化之后,数据会变得更加有可比性,具体原因还未找到可靠资料。
函数原型如下:
dst = cv2.normalize(src[, dst[, alpha[, beta[, norm_type[, dtype[, mask]]]]]])
参数说明:
- :输入数组;
- :与 src 大小相同的输出数组;
- :如果 norm_type 为 NORM_MINMAX ,则 alpha 为最小值或最大值,如果 norm_type 为其他类型,则为归一化要乘的系数;
- :如果 norm_type 为 NORM_MINMAX ,则 beta 为最小值或最大值,如果 norm_type 为其他类型,beta 被忽略,此处不会被用到,一般传入 0;
- :归一化类型,常见的有 NORM_L1, NORM_L2, NORM_INF, NORM_MINMAX;
- :如果取负值时,dst 与 src 同样的类型,否则,dst 和 src 有同样的通道数,且此时图像深度为 CV_MAT_DEPTH(dtype);
- :掩膜。
应用起来比较简单,例如本篇博客中的案例,只需要增加如下代码即可。
# 归一化处理cv.normalize(result, result, 0, 1, cv.NORM_MINMAX, -1)
橡皮擦的小节
希望今天的 1 个小时,你有所收获,我们下篇博客见~