经过 pytorch 模型输出的图像以 array 的形式呈现,其shape 如下(图片数量,通道数,长,宽),本文结合代码,介绍如何使用 matplotlib.pyplot.imsave()torchvision.utils.save_image() 将上述形式的图像保存下来。


目录

  • 归一化和反归一化
  • 注意
  • matplotlib.pyplot.imsave() 保存单张图片
  • 使用 torchvision.utils.save_image 将多个图片放进一张图里保存
  • 使用 torchvision 直接读取图片


归一化和反归一化

我们一般在模型训练之前,会把训练数据归一化(缩放均值为0方差为1),所以模型的输出也是归一化以后的输出,如果要保存图片,记得要进行反归一化(缩放到0-1的区间并还原原来的方差)后再保存。

归一化和反归一化的方法如下:

注意

  1. 如果保存为png格式的图片,那么再次打开后会发现其格式是(长,宽,4)的四通道而不是三通道图片,这是因为第一个通道代表了透明度,因此建议保存为jpg格式的图片。
  2. 如果用 plt.savefig() 进行图片的保存,会存在色差问题,因为 matplotlib 默认会把图片的第一个像素点设置成某种紫色,并不是实际意义上真正的颜色,参考:,如果需要呈现正确的rgb图案并且顺利保存,需要在呈现图片的代码(plt.imshow())前加一句:plt.set_cmap('binary') 就行了。

matplotlib.pyplot.imsave() 保存单张图片

打印和保存图片的格式维度都是:(长,宽,通道数)

import matplotlib.pyplot as plt
import numpy as np
import torch

pic = torch.rand(1,3,32,32) # 创建一个三通道的彩色噪声图像
pic  = pic.permute(0,2,3,1) # 记得要先进性维度的调整。通道数放最后
pic = np.array(pic) # 要转换成 np.array 才行
plt.imshow(pic[0]) # 先看看图片啥样 
plt.imsave('./test.png', pic[0])  # 保存时候的维度是 (长,宽,通道数),没有图片数量一说

pytorch layernorm 只对最后一个维度做归一化是不是和instance归一化一致_matplotlib

pytorch layernorm 只对最后一个维度做归一化是不是和instance归一化一致_matplotlib_02

使用 torchvision.utils.save_image 将多个图片放进一张图里保存

torchvision.utils.save_image() 的保存不需要将维度进行转换,保存的维度为:(样本数目,通道数,长,宽),并且其可以自动进行 normalize。

import matplotlib.pyplot as plt
import numpy as np
import torch
import torchvision

pic = torch.rand(16,3,32,32) # 创建16个三通道的彩色噪声图像
for i in range(16):  # 突出显示不同图片的差异
	pic[i] = torch.ones(3,32,32)*i/16

torchvision.utils.save_image(pic,'./test2.png',nrow=4,normalize=True)

pytorch layernorm 只对最后一个维度做归一化是不是和instance归一化一致_缩放_03

使用 torchvision 直接读取图片

先前读取图片到 torch.tensor 得先借助 PIL 这样的图片处理库,读取出来的格式由 (长,宽,通道数) 还得通过一定的函数转换成 (通道数,长,宽),参见:

但是 torchvision 本身可以直接读取图片,并按照 (通道数,长,宽) 的格式输出。

from torchvision.io import image

img=image.read_image('./test2.png')
print(type(img))
print(img.shape)

pytorch layernorm 只对最后一个维度做归一化是不是和instance归一化一致_缩放_04