卷积神经网络主要是处理一些有关图像处理的问题,众所周知,现在照片的图像表示是通过像素点完成的,一张图片是可能有由
个像素点组成的,每个像素点上又有代表了该像素点特征的信息,如RGB下分别有R值G值和B值(分别代表red,green和black)。
简单起见,我们可以把图像看成二维的具有长宽两个维度二维向量的输入。
互相关(crosscorrelation)
先来说说互相关,给一个二维的输入,我们那一个二维的滑动窗口,如下图给的是一个
的输入, 一个
的滑动窗口即核(kernel)。
两个蓝色块是目前选中的互相关运算区域,分别记为
和
,这个区域需要是维度相同的区域,图中所示都是
的区域,对两个区域中处于相同位置的元素做乘法,然后相加求和,即
。 该例中为
。 然后我们让窗口在输入矩阵上想右以及向下滑动, 以图中为例分别是
其上的互运算同理。
从互运算到卷积
其实了解了互运算,卷积(convolution)也差不多了。
假设卷积核是一个
的二维向量,卷积就是把互相关翻转了一下,变成了左上角乘右下角,右上角乘坐上角,即
(以1为下标起点)
带入第一个例子, 就变成了
(没算错吧,逃)
然后我们的CNN(最基础版)基本上就是把图像层使用卷积层处理之后,扔进MLP去训练,训练中一并把卷积核一起更新了。
所以我们引进了卷积,到底有什么帮助了呢。
通过卷积我们可以把图片进行了一个局部特征的提取(调参警告),有利于我们提取边缘特征,这样更方便我们对物体进行识别。
明天如果赶完作业的话,拿张炮姐的图输出下卷积后的效果试试看好了。