文章目录

  • ResNet、ResNeXt、迁移学习
  • 1、为什么要选择残差网络(ResNet)
  • ResNet总结
  • 3、ResNeXt网络结构(CVPR2017)
  • 基数(cardinality)是什么?
  • 网络结构
  • 4、实验对比
  • 5、ResNeXt总结
  • 6、迁移学习
  • 7、参考


ResNet、ResNeXt、迁移学习

1、为什么要选择残差网络(ResNet)

在VGG中,卷积网络达到了19层,在GoogLeNet中,网络史无前例的达到了22层。那么,网络的精度会随着网络的层数增多而增多吗?在深度学习中,网络层数增多一般会伴着下面几个问题:

1.计算资源的消耗(使用GPU集群)
2.模型容易过拟合(扩大数据集、Droupout、批量归一化、正则化、初始化参数调整等等方法)
3.梯度消失/梯度爆炸问题的产生(批量归一化)

随着网络层数的增加,网络发生了退化(degradation)的现象:随着网络层数的增多,训练集loss逐渐下降,然后趋于饱和,当你再增加网络深度的话,训练集loss反而会增大

注意:这并不是过拟合,因为在过拟合中训练loss是一直减小的。

怎么删除pytorch冲突的包 pytorch 删除层_卷积

当网络退化时,浅层网络能够达到比深层网络更好的训练效果,这时如果我们把低层的特征传到高层,那么效果应该至少不比浅层的网络效果差,我们可以当前层特征添加一条直接映射到下一层来达到此效果。

怎么删除pytorch冲突的包 pytorch 删除层_深度学习_02

在前向传输的过程中,随着层数的加深,Feature Map包含的图像信息会逐层减少,而ResNet的直接映射的加入,保证了下一层的网络一定比前一层包含更多的图像信息。基于这种使用直接映射来连接网络不同层直接的思想,残差网络应运而生。(退化现象)

![在这里插入图片描述](

怎么删除pytorch冲突的包 pytorch 删除层_人工智能_03

ResNet总结

怎么删除pytorch冲突的包 pytorch 删除层_深度学习_04

注意:

1.主分支与捷径分支的输出特征矩阵大小必须相同

2.resnet实线和虚线的区别:虚线部分是对特征矩阵的深度、高和宽都变换了,实线部分没有变化

怎么删除pytorch冲突的包 pytorch 删除层_迁移学习_05


怎么删除pytorch冲突的包 pytorch 删除层_人工智能_06

3、ResNeXt网络结构(CVPR2017)

基数(cardinality)是什么?

ResNeXt中提出的基数(cardinality)指的是分组卷积(group convolution)的分组数量,即输入的通道被平均分为多少组进行卷积计算。ResNeXt通过在每个残差块中使用分组卷积来增加网络的非线性和表现力,而基数就控制了每个卷积层中分组卷积的组数,从而影响了网络的复杂度和性能。

网络结构

这个网络结构是基于ResNet的,是ResNet的增强版。在这篇文章中,ResNeXt最大的一个亮点就是ResNeXt单元中引入了一种新的维度称为**“cardinality”,它代一个ResNeXt单元内相同的转换的个数,即分组的大小。实验表明,其它条件不变的情况下,增大cardinality的大小可以增大分类的准确率。

怎么删除pytorch冲突的包 pytorch 删除层_深度学习_07


如图所示,上面是论文提出的ResNeXt模块的三种的等价形式,第一种是输入的256通道特征图,通过32个1×1的卷积,生成32个通道数为4的特征图,然后每个组进行3×3的卷积,然后通过1*1的卷积升维到256通道,最后32个组的结果
相加融合**。第二种和第一种类似,只不过32组先进行concat,然后再通过1×1的卷积升维。第三种是先通过1*1的卷积降维为128通道的特征图,然后通过分组卷积后concat,最后用1×1的卷积进行升维。这里的分组卷积主要是来自于AlexNet。ResNeXt-50的整体网络结构如下(只是将ResNet单元换成了ResNeXt单元),而ResNeXt-101以及ResNeXt-152的结构也与此类推:

怎么删除pytorch冲突的包 pytorch 删除层_迁移学习_08


ResNeXt单元的设计遵循:1)如果生成相同尺寸的特征图,那么这些分组共享相同的超参数(卷积核尺寸和通道数);2)当特征图的尺寸下采样2倍时,特征图的通道数需要增加为原来的两倍,比如对于第一阶段的残差块的通道数为256时,分为32组,每组通道为数为4;而对于第二阶段的残差块通道数为512时,分为32组,每组的通道就为8。依此类推,通道数逐渐翻倍。

4、实验对比

怎么删除pytorch冲突的包 pytorch 删除层_深度学习_09


怎么删除pytorch冲突的包 pytorch 删除层_迁移学习_10

5、ResNeXt总结

1.使用分组让参数变得更少(是之前的1/g,g是组的个数)
2.错误率更低

6、迁移学习

怎么删除pytorch冲突的包 pytorch 删除层_人工智能_11


怎么删除pytorch冲突的包 pytorch 删除层_人工智能_12


怎么删除pytorch冲突的包 pytorch 删除层_怎么删除pytorch冲突的包_13


怎么删除pytorch冲突的包 pytorch 删除层_怎么删除pytorch冲突的包_14


注:不管有多少层,下边接近数据的也能拿到很大的梯度进行更新。

7、参考