OpenCV教程3(python)

图像的基础操作

这里虽然题目是图像的基础操作,下面也是关于一些图像的像素操作,但其实在OpenCV3中,图像用的是numpy里的ndarray类型存储的,所以这里的一些操作与numpy联系更密切一点。在OpenCV中最常用的图像有RGB图像(彩色)和灰度图(包括二值图)。

RGB图像是一个长*宽*3的array类型数组,例如:

OpenCV中的函数接口 python opencv教程python_OpenCV


这是一个2*2的彩色图片,它的array数组是:

[

[ [0,0,255],[0,0,0] ],

[ [255,0,0],[0,255,0] ]

]

灰度图只一个长*宽的array类型的数组,它不像彩色图有RGB三通道,灰度图只有一个单通道,表示灰度,范围是[0-255],0表示灰度最大,为黑色,255表示灰度最小,为白色。例如:

OpenCV中的函数接口 python opencv教程python_OpenCV中的函数接口 python_02


这是一个2*2的灰度图片,它的array数组是:

[

[ 80, 0 ],

[ 199,120 ]

]

1.获取并修改像素值

这里我们以彩色RGB图像为例,讲述获取和修改像素值。
首先我们要读入一幅图像

import cv2
import numpy as np
img=cv2.imread(r'opencv_logo.jpg')
cv2.imshow('logo',img)
cv2.waitKey(0)
cv2.destroyAllWindows()

opencv_logo.jpg图片链接

运行结果如下:

OpenCV中的函数接口 python opencv教程python_OpenCV中的函数接口 python_03


这里显示的是OpenCV的大logo,接下来让我们试着操作图片中的像素吧。

pixel1=img[200,200]
print(pixel1)
pixel2_blue=img[200,200,0]
print(pixel2_blue)

将上面的代码复制到一开始写的代码中。

输出结果:

OpenCV中的函数接口 python opencv教程python_OpenCV_04


注意:有些IDE中可能没有显示出输出结果,这时需要去掉代码的后三行。

cv2.imread返回的就是一个array数组,对RGB图像来讲,对本例子来讲,是个300*312*3的数组。img[200,200],索引第一个数字表示行,第二个数字表示列,返回200行,200列处的像素值,是个3通道的值;img[200,200,0],前两个数字一样,最后一个0表示三通道中的第一个蓝色通道的值(OpenCV彩色图像是用BGR形式表示的,这里需要注意一下)。

同样,我们也可修改像素值,

img[200,200] = [0,255,0]
#img[200,200,0] = [0],这行注释掉,之后将上面一行注释掉,运行这一行

运行一下程序:

OpenCV中的函数接口 python opencv教程python_OpenCV_05


同学们可能注意到蓝色弧形那边有一个小点颜色被改变了,仔细看!

如果是获取和修改单通道的值,推荐另外一种写法:

print(img.item(200,200,2)) #获取单通道的值
img.itemset((200,200,2),100) #修改单通道的值

注意:img.item和img.itemset只能获取和修改RGB单通道的值,或者灰度图的值。

这可能不明显,接下来让我们大面积的修改颜色吧。

img[180:220,180:220] = [0,255,0]

结果:

OpenCV中的函数接口 python opencv教程python_OpenCV_06


这下明显多了。这里用到了python中切片的概念,不懂得同学可以看看python和numpy的简单教程。这里修改了180-220行和180-220列这样一个矩形方块的颜色,将它设为绿色。

2.获取图像的属性
import cv2
import numpy as np
img=cv2.imread(r'opencv_logo.jpg')
print(img.shape)
#输出(300,312,3)
print(img.size)
#输出280800
print(img.dtype)
#输出uint8

img.shape 可以获取图像的形状。返回值是一个包含行数,列数,通道数的元组。灰度图只返回行数,列数这样一个元组。所以可以用这个来判断图片类型,是彩色图还是灰度图。

img.size返回图像array数组总的元素个数,对于彩色三通道图,就是行数*列数*3,对于灰度图就是行数*列数。

img.dtype返回图像的数据类型,也就是array数组的数据类型。

3.拆分及合并图像通道

有时需要对 BGR 三个通道分别进行操作。这时需要把 BGR 拆分成单个通道。有时需要把独立通道的图片合并成一个 BGR 图像。

import cv2
import numpy as np
img=cv2.imread(r'opencv_logo.jpg')
b,g,r=cv2.split(img)
img=cv2.merge([b,g,r])

cv2.split(img)返回b,g,r通道,cv2.merge([b,g,r])合并b,g,r通道。
上述两个方法属于OpenCV里的方法,比较耗时,建议直接使用numpy索引比较快。
例如:b=img[:,:,0]

4.总结

上面对图像的操作,其实本质就是对numpy.array操作,所以读者需要熟悉一下numpy库的一些简单操作。

下一节主要讲一下图像上的一些算法操作。