1 卷积网络的核心是:可以约减不必要的权值连接,引入稀疏或局部连接,带来权值共享策略大大地减少参数量相对的提升了数据量,从而可以避免过拟合;
具有平移不变性=鲁棒性较好。
优势:参数共享与稀疏连接,可以用更小的训练集来训练它,以便避免过拟合;
由于卷积特性,即使图片平移几个像素,其中依然具有非常相似的特征,同样属于相同的输出标记。
- 卷积操作的示意图如下:
卷积参数:stride:指的是窗口从当前位置到下一个位置,跳过的中间数据个数
- stride:
zero padding:将原始数据的周边补上0值的圈数。
- 卷积输出维度:
- 卷积中的通道channel
注意:channel就是叠加的3个三个黄色的卷积,最后的得到的是4X4X1,其中一个单元中的值是三个通道分别运算后得到的27个数相加
- 卷积中的卷积核kernel
下图有两个3X3X3的卷积核,分别对图像进行垂直和水平检测,对应的输出为4X4X2
- 一层卷积网路实例
设输入为a[0] 6X6X3 :经过卷积网络得到a[1] 4X4X2 , a[1]其实是原来图片a[0]的水平特征和垂直特征的提取共计 4X4X2个特征 ,如果想提取更多特征就设置多个卷积核
- 卷积网络中参数的总结
- 卷积网络(分类任务举例):卷积网络通常包括三层:CONV卷积层,POOL池化层,FC全连接层,下面这个例子是卷积层。后面会更新介绍另外两个
最后分类函数:logical识别有没有猫,softmax识别n种动物中的一种
最后一步是用分类函数处理7 X7X40= 1960个数据,
POOL池化层 卷积之后进行 池化操作:可以降低空间维度,减少计算量,刻画平移不变特性,增加提取特征的鲁棒性;可以约减下一层的输入维度(最大池化,平均池化,范数池化,对数概率池化以及空域金字塔池化,其中空域金字塔池化能够将任何尺度的图像的卷积特征转化成相同维度)
- max pooling
把4X4区域看成某些特征的集合,数字大的可能是提取了某个特征。池化的参数没有什么可学习的,一旦确定了参数,它就是一个固定运算。
卷积层输出大小的公式依然适用于单个池化输出大小的计算
3 FC全连接层
4 激活函数:非线性操作,通过弯曲或扭曲实现表征能力的提升
5 批量归一化:优化操作,减少训练过程中的不稳定性
卷积网络类型:分类网络——LeNet5 回答what;目标检测网络——faster R-CNN 回答where
特征学习
举个栗子:
各层参数(也许与上面那个栗子不太对应)
卷及网络实训举例: