- 图像基本操作
- opencv-python安装
- 一、图像读写操作
- 读取展示imread和imshow:
- 图片写入imwrite:
- 图像数据读取与转换操作
- 图像基础运算与融合
- 边界填充
- 数值计算
- 图像融合
图像基本操作
opencv-python安装
目前如果不指定版本,默认都是安装opencv 4.2以上版本的简化版,安装方式如下:
pip install opencv-python
# 如果上面的安装失败,请添加阿里或者清华源
pip install opencv-python -i https://pypi.tuna.tsinghua.edu.cn/simple
# 阿里 http://mirrors.aliyun.com/pypi/simple
而如果还是出现http time out问题,请去python离线包的网站找whl文件。
一、图像读写操作
读取展示imread和imshow:
在opencv中,如果还是在用的3以下版本的opencv,可以会有这种语法:
import cv2.cv as cv
# 读图片
image=cv.LoadImage('img/image.png', cv.CV_LOAD_IMAGE_COLOR)# Load the image
#Or just: image=cv.LoadImage('img/image.png')
cv.NamedWindow('image', cv.CV_WINDOW_AUTOSIZE) # Facultative
cv.ShowImage('image', image) #Show the image
# 写图片
cv.SaveImage("test.png", test)
cv.WaitKey(0)
但在4版本以后,用imread、imwrite和imshow替换了上面的语法:
import cv2 #opencv读取的格式是BGR
import matplotlib.pyplot as plt
import numpy as np
%matplotlib inline
"""
%pylab inline
# 这是使用了 `inline` 作为 matplotlib 的后端,
# 简单来说,就是简化代码,方面我们用最少的代码来在jupyter上画图
"""
img=cv2.imread(r'./1200/picture4.jpg')
imread第一个参数为读取图片路径,第二个参数为读入类型:
- cv2.IMREAD_COLOR:彩色图像,默认参数,忽略alpha通道
- cv2.IMREAD_GRAYSCALE:灰度图片
- cv2.IMREAD_UNCHANGED:读入完整图片,包括alpha通道
图片展示:
#图像的显示,也可以创建多个窗口
cv2.imshow('image',img)
# 等待时间,毫秒级,0表示任意键终止
cv2.waitKey(0)
cv2.destroyAllWindows()
# 函数式
def cv_show(name,img):
cv2.imshow(name,img)
cv2.waitKey(0)
cv2.destroyAllWindows()
如果我们不想手动进行waitKey关闭,可以设置时间为3000,转换一下就是3S,另外还可以cv2.destroyWindow(wname)销毁指定窗口。
图片写入imwrite:
这里我们可以结合上面的两个函数写一个完整程序:
import numpy as np
import cv2
img = cv2.imread('33.jpg')
cv2.imshow('image',img)
k = cv2.waitKey(0)
if k == 27: # wait for ESC key to exit
cv2.destroyAllWindows()
elif k == ord('s'): # wait for 's' key to save and exit
cv2.imwrite('messigray.png',img)
cv2.destroyAllWindows()
cv2.imwrite(file,img,num)第一个参数是要保存的文件名,第二个参数是要保存的图像。可选的是第三个参数:
- JPEG,参数为CV_IMWRITE_JPEG_QUALITY,它的值是从0到100,值越小压缩的越多,默认值是95.
- PNG,参数为CV_IMWRITE_PNG_COMPRESSION,它的值是从0到9,值越大表示图片尺寸越小,压缩时间越长。默认值是3。
- PPM,PGM或者PBM,参数为CV_IMWRITE_PXM_BINARY,它的值是0或者1。默认值是1。
其中cv2.IMWRITE_JPEG_QUALITY类型为 long ,必须转换成 int,其中png我试验是一张1M多的灰度图,选择1到9的差别,可以到300多k左右,而为什么不选jpeg或者更详细的说明见如下:
参数filename为所需保存图像的文件目录和文件名。这里的文件名需要带有图像格式后缀的,目前OpenCV该函数只支持JPEG,PNG,PPM,PGM,PBM,TIFF等。并不是所有Mat类型都支持。
img参数为图像数据来源,其类型为Mat。注意也不是所有格式的Mat型数据都能被使用保存为图片,目前OpenCV主要只支持单通道和3通道的图像,并且此时要求其深度为8bit和16bit无符号(即CV_16U)。所以其他一些数据类型是不支持的,比如说float型等。如果Mat类型数据的深度和通道数不满足上面的要求,则需要使用convertTo()函数和cvtColor()函数来进行转换。convertTo()函数负责转换数据类型不同的Mat,即可以将类似float型的Mat转换到imwrite()函数能够接受的类型。而cvtColor()函数是负责转换不同通道的Mat,因为该函数的第4个参数就可以设置目的Mat数据的通道数(只是我们一般没有用到它,一般情况下这个函数是用来进行色彩空间转换的)。另外也可以不用imwrite()函数来存图片数据,可以直接用通用的XML IO接口函数将数据存在XML或者YXML中。
图像数据读取与转换操作
截取部分图像数据:
img=cv2.imread('./1200/33.jpg')
image=img[0:50,0:200]
cv_show('image',image)
展示RGB的三种图像:
import matplotlib.pyplot as plt
b,g,r=cv2.split(img)
plt.subplot(231), plt.imshow(b, 'gray'), plt.title('B')
plt.subplot(232), plt.imshow(g, 'gray'), plt.title('G')
plt.subplot(233), plt.imshow(r, 'gray'), plt.title('R')
plt.show()
而使用完split后,如果想将三个单一通道聚合,可以使用img = cv2.merge((b,g,r))
便能回到3信道,这里就不展示了。
图像深浅复制:
不同于python的copy模块,python中浅复制是object.copy()、List[:],而深拷贝是object.deepcopy(),opencv中调用的是numpy中的copy,这本身就是一种深拷贝,而直接赋值是浅拷贝:
import numpy as np
a = np.arange(12) # a为一个序列
b = a
print('a shape:', a.shape)
print('compare:', b is a)
b.shape = 3, 4
print('a shape:', a.shape)
"""
a shape: (12,)
compare True
a shape: (3, 4)
"""
而如果是深拷贝,结果应该为:
a = np.arange(12)
d = a.copy()
print('compare:', d is a)
print('d是a嘛:', d.base is a)
"""
compare: False
d是a嘛: False
"""
图像基础运算与融合
边界填充
import matplotlib.pyplot as plt
plt.subplot(231), plt.imshow(img, 'gray'), plt.title('ORIGINAL')
plt.subplot(232), plt.imshow(replicate, 'gray'), plt.title('REPLICATE')
plt.subplot(233), plt.imshow(reflect, 'gray'), plt.title('REFLECT')
plt.subplot(234), plt.imshow(reflect101, 'gray'), plt.title('REFLECT_101')
plt.subplot(235), plt.imshow(wrap, 'gray'), plt.title('WRAP')
plt.subplot(236), plt.imshow(constant, 'gray'), plt.title('CONSTANT')
plt.show()
边界填充是我们要在原有图像上进行扩充的区域选择,具体的五种填充模式可以根据业务和所需要面积进行,另外详细的解释如下:
- BORDER_REPLICATE:复制法,也就是复制最边缘像素。
- BORDER_REFLECT:反射法,对感兴趣的图像中的像素在两边进行复制例如:fedcba|abcdefgh|hgfedcb
- BORDER_REFLECT_101:反射法,也就是以最边缘像素为轴,对称,gfedcb|abcdefgh|gfedcba
- BORDER_WRAP:外包装法cdefgh|abcdefgh|abcdefg
- BORDER_CONSTANT:常量法,常数值填充。
数值计算
img1=cv2.imread('./1200/picture22.jpg')
img2=cv2.imread('./1200/picture4.jpg')
img_1= img1 +10
img1[:5,:,0]
"""
array([[255, 255, 255, ..., 255, 255, 255],
[255, 255, 255, ..., 255, 255, 255],
[255, 255, 255, ..., 255, 255, 255],
[255, 255, 255, ..., 255, 255, 255],
[255, 255, 255, ..., 255, 255, 255]], dtype=uint8)
"""
img_1[:5,:,0]
"""
array([[9, 9, 9, ..., 9, 9, 9],
[9, 9, 9, ..., 9, 9, 9],
[9, 9, 9, ..., 9, 9, 9],
[9, 9, 9, ..., 9, 9, 9],
[9, 9, 9, ..., 9, 9, 9]], dtype=uint8)
"""
#相当于% 256
(img_1 + img1)[:5,:,0]
"""
array([[8, 8, 8, ..., 8, 8, 8],
[8, 8, 8, ..., 8, 8, 8],
[8, 8, 8, ..., 8, 8, 8],
[8, 8, 8, ..., 8, 8, 8],
[8, 8, 8, ..., 8, 8, 8]], dtype=uint8)
"""
cv2.add(img1,img_1)[:5,:,0]
"""
array([[255, 255, 255, ..., 255, 255, 255],
[255, 255, 255, ..., 255, 255, 255],
[255, 255, 255, ..., 255, 255, 255],
[255, 255, 255, ..., 255, 255, 255],
[255, 255, 255, ..., 255, 255, 255]], dtype=uint8)
"""
从上面的加减乘除中我们可以看到,除了%取余,其它都不会再进行进位,因为255是最高像素,所以大部分像素点会停留在255上不再改变。
图像融合
如果是需要两张图片相加,那么他们的信道数还有通道比一定要相同,否则会报错。
然后我们可以先对图片resize后再融合,resize的用法将在下一篇视频基本操作中总结,这里直接引出结果:
img1 = cv2.resize(img_dog, (500, 500))
img1.shape
img2 = cv2.resize(img_cat,(500,500))
img2.shape