卷积神经网络
- 卷积层
- 池化层
- 迁移学习
- 其他
卷积神经网络主要由以下五种结构组成
- 输入层。输入层是整个神经网络的输入 ,在处理图像 的卷积神经网络中,它一般代表了一张图片的像素矩阵。从输入层开始 ,卷积神经网络通过不同的神经网络结构将上一层的三维矩阵转化为下一层的三维矩阵 , 直到最后的全连接层。
- 卷积层。从名字就可以看出,卷积层是一个卷积神经网络中最为重要的部分。和传统全连接层不同 , 卷积层中每一个节点的输入只是上一层神经 网络的一小块,这个小块常用的大小有 3 × 3 或者 5 × 5。卷积层试图将神经网络中的每一小块进行更加深入地分析从而得到抽象程度更高的特征。通过卷积层处理过的节点矩阵会变得更深。
- 池化层( Pooling )。池化层神经网络不会改变三维矩阵的深度,但是它可以缩小矩阵的大小。池化操作可以认为是将一张分辨率较高的图片转化为分辨率较低的图片。缩小最后全连接层中节点的个数。
- 全连接层。在经过多轮卷积层和池化层的处理之后,在卷积神经网络的最后一般会是由 1 到 2 个全连接层来给出最后的分类结果。经过几轮卷积层和池化层的处理之后,可以认为图像中的信息已经被抽象成了信息含量更高的特征。我们可以将卷积层和池化层看成自动图像特征提取的过程 。 在特征提取完成之后,仍然需要使用全连接层来完成分类任务。
- Softmax 层。和前面介绍的一样, Softmax 层主要用于分类问题 。 通过 Softmax层 ,可以得到当前样例属于不同种类的概率分布情况。
卷积层
过滤器可以将当前层神经网络上的一个子节点矩阵转化为下一层神经网络上的一个单位节点矩阵 。单位节点矩阵指的是一个长和宽都为 1,但深度不限的节点矩阵 。
过滤器的前向传播过程就是通过左侧小矩阵中的节点计算出右侧单位矩阵中节点的过程。下面这个式子就是演示如何通过过滤器将一个 2 × 2 × 3 的节点矩阵变化为一个
1 × 1 × 5 的单位节点矩阵。i表示输出单位节点举证的第i个节点,这里是是5个,所以会有g(0)~g(4)的结果输出,滤波器通过输入节点(x,y,z)的权重,使用bi 来便是偏执参数,这样g(i)就有了下面的公式
试一个g(0)是如何出来的,因为给定的节点的深度是三,那么滤波器的深度也要和给定的深度一样的也是三。a和w。这样点乘就能算出来g(0)的取值了。因为下一层的单位节点的深度是5,所以还有g(1)~g(4)的输出,还要有不同的权重来计算。
算出了一个,还有那么多呢,滤波器在平面上移动计算就好啦。所以卷积层结构的前向传播过程就是通过将一个过滤器从神经网络当前层的左上角移动到右下角,并且在移动中计算每一个对应的单位矩阵得到的 。将这些得到的数值拼接成一个新的矩阵,就完成了卷积层前向传播的过程。
这就是滤波器参数共享。(用一个滤波器去移动整个平面难道还要变换参数么?)
卷积神经网络中,每一个卷积层中使用的过滤器中的参数都是一样的。这是卷积神经网络一个非常重要的性质。卷积层的参数个数和图片的大小无关,它只和过滤器的尺寸、深度以及当前层节点矩阵的深度有关。这使得卷积神经网络可以很好地扩展到更大的图像数据上。
滤波器的这个权重参数还没讲呢
池化层
池化层可以非常有效地缩小矩阵的尺寸(一般主要减少矩阵的长和宽,对深度不做要求),从而减少最后全连接层中的参数。使用池化层既可以加快计算速度也有防止过拟合问题的作用。
和卷积层类似,池化层前向传播的过程也是通过移动一个类似过滤器的结构完成的 。不过池化层过滤器中的计算不是节点的加权和 ,而是采用更加简单的最大值或者平均值运算。
使用最大值操作的池化层被称之为最大池化层( max pooling ),这是被使用得最多的池化层结构。使用平均值操作的池化层被称之为平均池化层(average pooling)。
卷积层使用的过滤器是横跨整个深度的,而池化层使用 的过滤器只影响一个深度上的节点。
迁移学习
随着技术的发展,卷积模型越来越复杂,所需要的训练标记数据或特别多,而且即便有海量的训练数据,训练一个复杂的卷积神经网络也需要几天甚至几周的时间。于是就有了迁移学习,迁移学习就是将一个问题上训练好的模型通过简单的调整使其适用于一个新的问题 。
在最后这一层全连接层之前的网络层称之为瓶颈层( bottleneck ) 。将新的图像通过训练好的卷积神经网络直到瓶颈层的过程可以看成是对图像进行特征提取的过程 。
其他
经典的用于图片分类问题的卷积神经网络架构 :
输入层→(卷积层+→池化层?)+→全连接层+