• 图像基本操作
  • opencv-python安装
  • 一、图像读写操作
  • 读取展示imread和imshow:
  • 图片写入imwrite:
  • 图像数据读取与转换操作
  • 图像基础运算与融合
  • 边界填充
  • 数值计算
  • 图像融合


图像基本操作

opencv-python安装

目前如果不指定版本,默认都是安装opencv 4.2以上版本的简化版,安装方式如下:

pip install opencv-python
# 如果上面的安装失败,请添加阿里或者清华源
pip install opencv-python -i https://pypi.tuna.tsinghua.edu.cn/simple
# 阿里 http://mirrors.aliyun.com/pypi/simple

而如果还是出现http time out问题,请去python离线包的网站找whl文件。

一、图像读写操作

读取展示imread和imshow:

在opencv中,如果还是在用的3以下版本的opencv,可以会有这种语法:

import cv2.cv as cv

# 读图片
image=cv.LoadImage('img/image.png', cv.CV_LOAD_IMAGE_COLOR)# Load the image
#Or just: image=cv.LoadImage('img/image.png')

cv.NamedWindow('image', cv.CV_WINDOW_AUTOSIZE) # Facultative
cv.ShowImage('image', image) #Show the image

# 写图片
cv.SaveImage("test.png", test)
cv.WaitKey(0)

但在4版本以后,用imread、imwrite和imshow替换了上面的语法:

import cv2 #opencv读取的格式是BGR
import matplotlib.pyplot as plt
import numpy as np 
%matplotlib inline 
"""
%pylab inline 
# 这是使用了 `inline` 作为 matplotlib 的后端,
# 简单来说,就是简化代码,方面我们用最少的代码来在jupyter上画图
"""

img=cv2.imread(r'./1200/picture4.jpg')

imread第一个参数为读取图片路径,第二个参数为读入类型:

  • cv2.IMREAD_COLOR:彩色图像,默认参数,忽略alpha通道
  • cv2.IMREAD_GRAYSCALE:灰度图片
  • cv2.IMREAD_UNCHANGED:读入完整图片,包括alpha通道

图片展示:

#图像的显示,也可以创建多个窗口
cv2.imshow('image',img) 
# 等待时间,毫秒级,0表示任意键终止
cv2.waitKey(0) 
cv2.destroyAllWindows()

# 函数式
def cv_show(name,img):
    cv2.imshow(name,img) 
    cv2.waitKey(0) 
    cv2.destroyAllWindows()

如果我们不想手动进行waitKey关闭,可以设置时间为3000,转换一下就是3S,另外还可以cv2.destroyWindow(wname)销毁指定窗口。

cv2 python 图像为零 python图像处理opencv_cv2 python 图像为零

图片写入imwrite:

这里我们可以结合上面的两个函数写一个完整程序:

import numpy as np
import cv2

img = cv2.imread('33.jpg')
cv2.imshow('image',img)
k = cv2.waitKey(0)
if k == 27:         # wait for ESC key to exit
    cv2.destroyAllWindows()
elif k == ord('s'): # wait for 's' key to save and exit
    cv2.imwrite('messigray.png',img)
    cv2.destroyAllWindows()

cv2.imwrite(file,img,num)第一个参数是要保存的文件名,第二个参数是要保存的图像。可选的是第三个参数:

  • JPEG,参数为CV_IMWRITE_JPEG_QUALITY,它的值是从0到100,值越小压缩的越多,默认值是95.
  • PNG,参数为CV_IMWRITE_PNG_COMPRESSION,它的值是从0到9,值越大表示图片尺寸越小,压缩时间越长。默认值是3。
  • PPM,PGM或者PBM,参数为CV_IMWRITE_PXM_BINARY,它的值是0或者1。默认值是1。

其中cv2.IMWRITE_JPEG_QUALITY类型为 long ,必须转换成 int,其中png我试验是一张1M多的灰度图,选择1到9的差别,可以到300多k左右,而为什么不选jpeg或者更详细的说明见如下:

参数filename为所需保存图像的文件目录和文件名。这里的文件名需要带有图像格式后缀的,目前OpenCV该函数只支持JPEG,PNG,PPM,PGM,PBM,TIFF等。并不是所有Mat类型都支持。

img参数为图像数据来源,其类型为Mat。注意也不是所有格式的Mat型数据都能被使用保存为图片,目前OpenCV主要只支持单通道和3通道的图像,并且此时要求其深度为8bit和16bit无符号(即CV_16U)。所以其他一些数据类型是不支持的,比如说float型等。如果Mat类型数据的深度和通道数不满足上面的要求,则需要使用convertTo()函数和cvtColor()函数来进行转换。convertTo()函数负责转换数据类型不同的Mat,即可以将类似float型的Mat转换到imwrite()函数能够接受的类型。而cvtColor()函数是负责转换不同通道的Mat,因为该函数的第4个参数就可以设置目的Mat数据的通道数(只是我们一般没有用到它,一般情况下这个函数是用来进行色彩空间转换的)。另外也可以不用imwrite()函数来存图片数据,可以直接用通用的XML IO接口函数将数据存在XML或者YXML中。

图像数据读取与转换操作

截取部分图像数据:

img=cv2.imread('./1200/33.jpg')
image=img[0:50,0:200] 
cv_show('image',image)

cv2 python 图像为零 python图像处理opencv_计算机视觉_02

展示RGB的三种图像:

import matplotlib.pyplot as plt
b,g,r=cv2.split(img)
plt.subplot(231), plt.imshow(b, 'gray'), plt.title('B')
plt.subplot(232), plt.imshow(g, 'gray'), plt.title('G')
plt.subplot(233), plt.imshow(r, 'gray'), plt.title('R')

plt.show()

cv2 python 图像为零 python图像处理opencv_python_03


而使用完split后,如果想将三个单一通道聚合,可以使用img = cv2.merge((b,g,r))便能回到3信道,这里就不展示了。

图像深浅复制:

不同于python的copy模块,python中浅复制是object.copy()、List[:],而深拷贝是object.deepcopy(),opencv中调用的是numpy中的copy,这本身就是一种深拷贝,而直接赋值是浅拷贝:

import numpy as np
a = np.arange(12) # a为一个序列
b = a 
print('a shape:', a.shape)  
print('compare:', b is a)  
b.shape = 3, 4 
print('a shape:', a.shape) 

"""
a shape: (12,)
compare True
a shape: (3, 4)
"""

而如果是深拷贝,结果应该为:

a = np.arange(12)
d = a.copy()
print('compare:', d is a)
print('d是a嘛:', d.base is a)

"""
compare: False
d是a嘛: False
"""

图像基础运算与融合

边界填充

import matplotlib.pyplot as plt
plt.subplot(231), plt.imshow(img, 'gray'), plt.title('ORIGINAL')
plt.subplot(232), plt.imshow(replicate, 'gray'), plt.title('REPLICATE')
plt.subplot(233), plt.imshow(reflect, 'gray'), plt.title('REFLECT')
plt.subplot(234), plt.imshow(reflect101, 'gray'), plt.title('REFLECT_101')
plt.subplot(235), plt.imshow(wrap, 'gray'), plt.title('WRAP')
plt.subplot(236), plt.imshow(constant, 'gray'), plt.title('CONSTANT')

plt.show()

cv2 python 图像为零 python图像处理opencv_cv2 python 图像为零_04

边界填充是我们要在原有图像上进行扩充的区域选择,具体的五种填充模式可以根据业务和所需要面积进行,另外详细的解释如下:

  • BORDER_REPLICATE:复制法,也就是复制最边缘像素。
  • BORDER_REFLECT:反射法,对感兴趣的图像中的像素在两边进行复制例如:fedcba|abcdefgh|hgfedcb
  • BORDER_REFLECT_101:反射法,也就是以最边缘像素为轴,对称,gfedcb|abcdefgh|gfedcba
  • BORDER_WRAP:外包装法cdefgh|abcdefgh|abcdefg
  • BORDER_CONSTANT:常量法,常数值填充。

数值计算

img1=cv2.imread('./1200/picture22.jpg')
img2=cv2.imread('./1200/picture4.jpg')

img_1= img1 +10 
img1[:5,:,0]
"""
array([[255, 255, 255, ..., 255, 255, 255],
       [255, 255, 255, ..., 255, 255, 255],
       [255, 255, 255, ..., 255, 255, 255],
       [255, 255, 255, ..., 255, 255, 255],
       [255, 255, 255, ..., 255, 255, 255]], dtype=uint8)
"""

img_1[:5,:,0]
"""
array([[9, 9, 9, ..., 9, 9, 9],
       [9, 9, 9, ..., 9, 9, 9],
       [9, 9, 9, ..., 9, 9, 9],
       [9, 9, 9, ..., 9, 9, 9],
       [9, 9, 9, ..., 9, 9, 9]], dtype=uint8)
"""

#相当于% 256
(img_1 + img1)[:5,:,0] 
"""
array([[8, 8, 8, ..., 8, 8, 8],
       [8, 8, 8, ..., 8, 8, 8],
       [8, 8, 8, ..., 8, 8, 8],
       [8, 8, 8, ..., 8, 8, 8],
       [8, 8, 8, ..., 8, 8, 8]], dtype=uint8)
"""

cv2.add(img1,img_1)[:5,:,0]
"""
array([[255, 255, 255, ..., 255, 255, 255],
       [255, 255, 255, ..., 255, 255, 255],
       [255, 255, 255, ..., 255, 255, 255],
       [255, 255, 255, ..., 255, 255, 255],
       [255, 255, 255, ..., 255, 255, 255]], dtype=uint8)
"""

从上面的加减乘除中我们可以看到,除了%取余,其它都不会再进行进位,因为255是最高像素,所以大部分像素点会停留在255上不再改变。

图像融合

如果是需要两张图片相加,那么他们的信道数还有通道比一定要相同,否则会报错。

然后我们可以先对图片resize后再融合,resize的用法将在下一篇视频基本操作中总结,这里直接引出结果:

img1 = cv2.resize(img_dog, (500, 500))
img1.shape

img2 = cv2.resize(img_cat,(500,500))
img2.shape

cv2 python 图像为零 python图像处理opencv_opencv_05