卷积计算过程
目录
摘要
一、全连接网络回顾
二、卷积计算的概念
三、卷积核的使用
三、卷积核示例
四、卷积的计算过程
五、卷积计算过程动图显示
摘要
卷积计算可以认为是一种有效提取图像特征的方法。
一、全连接网络回顾
全连接 NN 特点:每个神经元与前后相邻层的每一个神经元都有连接关系。(可以实现分类和预测)
全连接网络的参数个数为:
如下图所示,针对一张分辨率仅为 28 * 28 的黑白图像(像素值个数为 28 * 28 * 1 = 784),全连接网络的参数总量就有将近 10 万个。
在实际应用中,图像的分辨率远高于此,且大多数是彩色图像,如下图所示。虽然全连接网络一般被认为是分类预测的最佳网络,但待优化的参数过多,容易导致模型过拟合。
为了解决参数量过大而导致模型过拟合的问题,一般不会将原始图像直接输入,而是先对图像进行特征提取,再将提取到的特征输入全连接网络,让全连接网络输出识别结果。如下图所示,就是将汽车图片经过多次特征提取后再喂入全连接网络,进行识别。
二、卷积计算的概念
卷积计算:可以认为是一种有效提取图像特征的方法。
一般会用一个正方形的卷积核,按指定步长,在输入特征图上滑动,遍历输入特征图中的每个像素点。
每一个步长,卷积核会与输入特征图出现重合区域,重合区域对应元素相乘、求和再加上偏置项得到输出特征的一个像素点。
三、卷积核的使用
1、如果输入特征是单通道灰度图,如下如所示。使用深度为1的单通道卷积核。
2、如果输入特征是三通道彩色图,如下如所示。可以使用 3 * 3 * 3 的卷积核,或者使用 5 * 5 * 3 的卷积核。
总之,要使得卷积核的通道数与输入特征图的通道数一致。因为要想让卷积核与输入特征图对应点匹配上,必须让卷积核的深度与输入特征图的深度一致。
由于每个卷积核在卷积计算后会得到一张输出特征图,所以当前层使用了几个卷积核就有几张输出特征图。
结论:
a、用多个卷积核可以实现对同一层输入特征的多次特征提取;
b、输入特征图的深度(channel数),决定了当前层卷积核的深度;
c、当前层卷积核的个数,决定了当前层输出特征图的深度(如果我们觉得某层模型的特征提取能力不足,可以在这一层多用几个卷积核提高这一层的特征提取能力)。
三、卷积核示例
如下图所示,里面的每一个小颗粒,都存储着一个待训练参数。
在执行卷积计算时,卷积核里的这些参数是固定的。
在每次反向传播时,这些小颗粒中存储的待训练参数,会被梯度下降法更新。
卷积,就是利用立体卷积核,实现了参数的空间共享。
四、卷积的计算过程
1、如下图所示,利用大小为 3 * 3 * 1 的卷积核对 5 * 5 * 1 的单通道图像做卷积计算得到相应结果。
2、对于彩色图像(多通道)来说,卷积核通道数与输入特征一致,套接后在对应位置上进行乘加操作。如下图所示,利用三通道卷积核对三通道的彩色特征图做卷积计算。
这个例子的输入特征图,是 5 行 5 列红绿蓝三通道数据。
选用 3 * 3 * 3 三通道卷积核,滑动步长是 1。
在这个输入特征图上滑动,每滑动一步输入特征图与卷积核里的 27 个元素重合,它们对应元素相乘求和再加上偏置项 b。
比如,卷积核滑动到图中的位置,红绿蓝三层分别与卷积核的三层特征数据重合,它们对应元素相乘求和加上偏置项 b,得到输出特征图中的一个像素值 6。
这就是卷积计算过程。
五、卷积计算过程动图显示
1、卷积核在输入特征图上,按指定步长滑动。
2、每个步长,卷积核会与输入特征图上的部分像素点重合。
3、重合区域,输入特征图与卷积核对应元素相乘求和,得到输出特征图中的一个像素点。
4、当输入特征图被遍历完成,得到一张输出特征图,完成了一个卷积核的卷积计算过程。
5、当有 n 个卷积核时,会有 n 张输出特征图,叠加在这张输出特征图的后边。