文章目录
- 1. 超声图像归一化
- 2. 超声图像标准化
- 3. 计算整个数据集均值和标准差的方法
1. 超声图像归一化
概念:图像的像素值通常为[0,255],归一化是指把所有像素都除以255,将其转换到[0,1]之间。
作用:
- 数值稳定性:图像归一化可以使图像中的像素值变化在一个较小的范围内,并且保持相对稳定的比例关系,提高算法的数值稳定性和收敛速度。
- 信息提取:使得不同图像之间的像素值具有可比性。这样一来,算法可以更加准确地提取图像的纹理、边缘和其他特征,从而提高图像处理和计算机视觉任务的效果。
- 模型的泛化能力:使模型在不同的图像数据上表现更稳定,使其更好地适应不同的数据分布。通过将图像归一化到一个统一的范围内,可以减少不同图像之间的亮度和对比度的变化,从而降低模型对这些变化的敏感性。
- 加速模型学习的过程:在深度学习中,通过梯度下降算法进行优化时,归一化可以使不同特征的梯度变化范围保持一致。这有助于加速算法的收敛过程,并且可以提高梯度下降算法的效率和稳定性。
2. 超声图像标准化
概念:通过将图片减去均值和除以标准差的方式,使图像像素分布符合正态分布,即像素均值为0,标准差为1。
作用:
- 去除均值:图像标准化将每个像素值减去图像整体的均值。这有助于消除图像中的整体亮度偏移。在训练深度学习模型时,去除均值可以加速模型的收敛,使得模型更容易学到数据的特征。
- 缩放数据范围: 通过除以标准差,图像标准化将像素值缩放到具有单位方差的范围内。这有助于平衡不同特征的尺度,防止某些特征对模型的训练产生过大的影响。
- 增加模型稳定性: 标准化可以提高模型对输入数据的稳定性,减少了数据中的变化。这有助于模型更好地泛化到未见过的数据,并降低过拟合的风险。
说明:超声图像是灰度图像,在处理的时候直接读取成灰度图再进行归一化和标准化即可得到想要的效果。
如果的自然图像,需要读取成三通道图像,并分别计算每个通道的均值和标准差,然后分别标准化。
这里没搞懂的问题是,我将单通道的超声图像读取成三通道图像,每个通道的像素值都一样,使用相同的均值和方差计算后,再组合到一起显示出的图像(图1)和直接读取单通道图像计算后的结果(图2)差别很大,不知道为什么?
3. 计算整个数据集均值和标准差的方法
# 定义dataset
class my_original_Seg(Dataset):
def __init__(self, list_path):
self.list_path = list_path
self.img_list = [line.strip().split() for line in open(list_path)]
self.files = self.read_files()
def read_files(self): # 这里是自己添加的读取数据路径的方法,可以根据自己的情况修改
files = []
for item in self.img_list:
image_path = item
name = os.path.splitext(os.path.basename(image_path[0]))[0]
files.append({
"img": image_path[0],
"name": name,
})
return files
def __getitem__(self, index):
item = self.files[index]
image_path = "..." # 读成自己的路径
image = cv2.imread(image_path,0)
return image
def __len__(self):
return len(self.img_list)
mean_dataset = my_original_Seg(list_path=dataset_list_pat)
mean_loader = torch.utils.data.DataLoader(
mean_dataset,
batch_size=32,
shuffle=False,
pin_memory=False)
# 初始化通道平均值和标准差(这里计算的是三通道的,可以根据情况改成只计算单通道的)
means = torch.zeros(3)
stds = torch.zeros(3)
for i_iter, batch in enumerate(mean_loader, 0):
# print(batch.shape)
batch = batch.float()
for c in range(3):
means[c] += batch[:, :, :, c].mean()
stds[c] += batch[:, :, :, c].std()
means = means / len(mean_loader)
stds = stds / len(mean_loader)
print(means / 255)
print(stds / 255)