一、问题所在

今天用Python做有关图像读取与显示的实验时无意间遇到了这样的一个小问题。

待处理的原始图像如下:

图1.1 杜鹃花

我的本意是通过使用cv2与pyplot,先将原图像显示出来,然后将转换过后的灰度图像再显示出来,从而对比观察二者的区别,就像下图所示:

图1.2 原图与灰度图

然而理想很丰满,现实很骨感。我发现,我显示的原图像总是蓝色色调的。嗯,没错,就是蓝色的。就像这样:

图1.3 蓝色的杜鹃

额。。。我明明什么都没有做,就是简单的一个显示原图像,为啥还变色了尼?虽然看起来也挺好看的,但是毕竟还是要追求真理的呀。带着这样的疑问,我开始了自己的“探索之路”。

二、问题分析

2.1

首先我在想,是不是我的屏幕配色或是自己的视觉出现了问题?因为自己有过这样的经历:Ubuntu的配色貌似比Windows 10的配色要鲜艳一些。而且盯了一天电脑屏幕了,总会有视觉疲劳的。验证这个问题最好的办法就是看一下图像的颜色直方图:

chans = cv2.split(img)
colors = ('b', 'g', 'r')
plt.figure('颜色直方图')
plt.title("’Flattened’ Color Histogram")
plt.xlabel("Bins")
plt.ylabel("# of Pixels")
for (chan, color) in zip(chans, colors):
hist = cv2.calcHist([chan], [0], None, [256], [0, 256])
plt.plot(hist, color = color)
plt.xlim([0, 256])
plt.show()

图2.1 颜色直方图

额,从图中可以看到,确实是蓝色的像素最多,那么这个假设就被我们成功的Pass了。

2.2

好吧,暂时先庆幸一下自己还没有色盲的症状。那么我不禁想,简单的一个读取图片加显示的工作,也就两行代码的工作量。显示图片肯定不会出错,毕竟只需要plt.imshow()就行,那就只能是读取图片的时候有一些差错。这里我是直接使用了cv2中的imread方法来读取的图像:

img = cv2.imread(path)

直接读取img并进行显示,就是一朵蓝色的杜鹃花。不过当我转用Image模块中的方法读取图片并显示的时候,就没有任何的问题,显示的图片也没有变色。

from PIL import Image
path = '62.jpg'
img = Image.open(path)
plt.figure('原图像')
plt.imshow(img)
plt.show()

按理来说,图像都应该是按照矩阵的形式进行存储和读取的,不能因为我换了一个模块的方法进行读取它就变色了。而且通过观察图1.3也可以发现,只有原图变蓝了,而经过方法

cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

进行转换后的灰度图像在显示的时候就没有变蓝。

2.3

感觉自己已经越来越接近事实的真相了。那既然这样,我们就查一查cv2.imread()的方法定义吧。放一张官方文档的说明:

图2.2 说明

额,看到这里我貌似明白了什么。cv2.imread()接口读进来的图像是BGR格式的啊,而我想要显示的彩色图像是RGB格式的,怪不得会显示蓝色居多。。。为了验证自己的猜测,我将读取进来的img又加了一步类型转换,将其变为RGB图像:

img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)

这回果然颜色正常了。

三、结论

大家在使用cv2.imread()读取彩色图像后得到的格式是BGR格式,像素值范围在0~255之间,通道格式为(H,W,C),想要显示RGB类型的图像要进行一步格式转换。不过直接用Image等库读取图像的话貌似不需要进行格式转换。

写在后面:

其实这个问题属于比较弱智的一个问题,完全是因为自己对接口定义不了解而随便使用导致的,实际debug的话也就花了10min左右查查接口文档写个小程序检验一下就Ok了。写出来的目的一是为了提醒自己注意这个知识点,二是想分享一下自己思考的一个过程。一般来说自己在平时debug的时候也是确定bug位置、查资料、写demo验证这三个步骤。个人感觉计算机专业的学生debug的能力还是十分重要的,遇到问题不要总想着张嘴问别人,先尽量凭借自己的能力去解决。刚开始的时候可能会有些困难,也会比较费时间。但是当问题解决后会觉得很有成就感,而且时间长了也会对编程能力的提高有促进作用。