函数: cv.pyrUp(), cv.pyrDown()
1. 理论
通常,我们使用尺寸固定的图像。但在某些情况下,我们需要使用不同分辨率的(相同)图像。例如,当我们在图像中搜索物体时,比如人脸,我们并不确定物体出现在图像中的大小。在这种情况下,我们需要创建一组具有不同分辨率的图像,并在所有图像中搜索对象。这些不同分辨率的图像被称为图像金字塔(如果将它们放在一起,最高分辨率的图像在底部,最低分辨率的图像在顶部,它看起来像一个金字塔)。
图像金字塔有两种:高斯金字塔和拉普拉斯金字塔
2. 高斯金字塔
高斯金字塔的高层(低层)图像是通过去除低层(高层)图像中的连续行和列来实现的。再由下一层的5个像素的高斯权值贡献构成上一层的每个像素。这样,一个M×N图像就变成了M/2×N/2图像。所以面积减少到原来的四分之一。它被称为Octave。同样的模式持续到金字塔的上方(即分辨率下降)。同样地,在扩展过程中,每一层的面积会增加4倍。我们可以使用cv.pyrDown()和cv.pyrUp()函数找到高斯金字塔。
img = cv.imread('messi5.jpg')
lower_reso = cv.pyrDown(higher_reso)
下面是一个图像金字塔的4层。
可以使用cv.pyrUp()函数放大图像
higher_reso2 = cv.pyrUp(lower_reso)
请记住,higher_reso2并不等于higher_resso,因为一旦降低分辨率,信息就会丢失。下面的图像是从上一个例子中最小的图像创建的金字塔下3层。将其与原始图像进行比较
3. 拉普拉斯金字塔
拉普拉斯金字塔是由高斯金字塔形成的。拉普拉斯金字塔图像就像边缘图像。它的大部分元素都是0。它们用于图像压缩。拉普拉斯金字塔的层次是由高斯金字塔的这一层次与高斯金字塔上一层次的扩展版之间相减形成的。Laplacian层次的三个层次如下(调整对比度以增强内容):
4. 使用图像金字塔实现图像混合
金字塔的一个应用是图像混合。
例如,在图像拼接中,你将需要将两个图像叠加在一起,但由于图像之间的不连续性,可能看起来不太好。
在这种情况下,使用金字塔图像混合可以实现无缝混合,而不会在图像中留下太多数据。
其中一个经典的例子就是混合两种水果,橙子和苹果。
现在看看结果本身来理解我在说什么:
简单地说就是这样做的:
-
加载苹果和橘子的两个图像
-
寻找苹果和橘子的高斯金字塔(在这个例子中,层数是6)
-
从高斯金字塔,找到他们的拉普拉斯金字塔
-
现在把苹果的左半部分和橘子的右半部分加入拉普拉斯金字塔的每一层
-
最后,从这个联合图像金字塔,重建原始图像。
下面是完整的代码。(为了简单起见,每个步骤都是单独完成的
import cv2 as cv
import numpy as np,sys
A = cv.imread('apple.jpg')
B = cv.imread('orange.jpg')
# generate Gaussian pyramid for A
G = A.copy()
gpA = [G]
for i in range(6):
G = cv.pyrDown(G)
gpA.append(G)
# generate Gaussian pyramid for B
G = B.copy()
gpB = [G]
for i in range(6):
G = cv.pyrDown(G)
gpB.append(G)
# generate Laplacian Pyramid for A
lpA = [gpA[5]]
for i in range(5,0,-1):
GE = cv.pyrUp(gpA[i])
L = cv.subtract(gpA[i-1],GE)
lpA.append(L)
# generate Laplacian Pyramid for B
lpB = [gpB[5]]
for i in range(5,0,-1):
GE = cv.pyrUp(gpB[i])
L = cv.subtract(gpB[i-1],GE)
lpB.append(L)
# Now add left and right halves of images in each level
LS = []
for la,lb in zip(lpA,lpB):
rows,cols,dpt = la.shape
ls = np.hstack((la[:,0:cols/2], lb[:,cols/2:]))
LS.append(ls)
# now reconstruct
ls_ = LS[0]
for i in range(1,6):
ls_ = cv.pyrUp(ls_)
ls_ = cv.add(ls_, LS[i])
# image with direct connecting each half
real = np.hstack((A[:,:cols/2],B[:,cols/2:]))
cv.imwrite('Pyramid_blending2.jpg',ls_)
cv.imwrite('Direct_blending.jpg',real)