【深度学习】ResNet系列网络结构

  • ResNet中Residual的功能
  • DNN的反向传播算法
  • 梯度弥散和梯度爆炸
  • 网络退化
  • ResNet中Residual的功能
  • ResNet系列网络结构
  • 结语


ResNet中Residual的功能

DNN的反向传播算法

  • 假设DNN只有一个隐藏层:
  • INCEPTION resnet v2网络架构 resnet网络结构详解_权重

  • 向前传播得到输出:
  • INCEPTION resnet v2网络架构 resnet网络结构详解_人工智能_02

  • 计算损失函数:
  • INCEPTION resnet v2网络架构 resnet网络结构详解_人工智能_03

  • 注意当INCEPTION resnet v2网络架构 resnet网络结构详解_人工智能_04关于INCEPTION resnet v2网络架构 resnet网络结构详解_深度学习_05求偏导的时候,无论括号中是INCEPTION resnet v2网络架构 resnet网络结构详解_权重_06还是INCEPTION resnet v2网络架构 resnet网络结构详解_权重_07,得到的结果是相同的
  • 反向传播更新权重:
  • INCEPTION resnet v2网络架构 resnet网络结构详解_机器学习_08


  • INCEPTION resnet v2网络架构 resnet网络结构详解_权重_09

  • 为什么是上图中是减法:因为优化的目的是让损失函数最小,也就是INCEPTION resnet v2网络架构 resnet网络结构详解_深度学习_10INCEPTION resnet v2网络架构 resnet网络结构详解_机器学习_11最接近。当偏导大于零时,证明损失函数关于权重的函数曲线极小值在INCEPTION resnet v2网络架构 resnet网络结构详解_人工智能_12轴左侧,当偏导小于零时,证明损失函数关于权重的函数曲线极小值在INCEPTION resnet v2网络架构 resnet网络结构详解_人工智能_12轴右侧。

梯度弥散和梯度爆炸

梯度弥散:靠近网络输入端的权重梯度小,得不到更新
梯度爆炸:靠近网络输出端的权重梯度大,更新特别“飞”

无论是梯度弥散还是梯度爆炸,都是靠近网络输出端的梯度大于靠近网络输入端的梯度。因为:
根据上面的反向传播推导可知,从靠近网络输出端向靠近网络输入端,每向后一层,反向传播的偏导计算便多乘一次激活函数的导,以sigmoid函数作为激活函数为例,它的导数是恒小于一的。所以这样反向传播每向后一层,都在累乘小于一的值。所以靠近网络输出端的梯度大于靠近网络输入端的梯度

网络退化

在增加网络层数的过程中,training accuracy 逐渐趋于饱和,继续增加层数,training accuracy 就会出现下降的现象,而这种下降不是由过拟合造成的

ResNet中Residual的功能

残差网络结构的提出,就是解决了随着网络层数的加深,出现的梯度弥散、梯度爆炸、以及网络退化的现象。

换句话说,ResNet的跳接就是为了提高梯度跨block传播的能力

ResNet系列网络结构

注意ResNet的激活函数放在跳接之后

INCEPTION resnet v2网络架构 resnet网络结构详解_卷积_14

  1. 上图中输入图片size为(224, 224, 3)
  2. 经过第一个7x7的卷积层,输出channel为64,步长为2,注意pad为3,即在周围填充三圈
  3. 经过一个3x3的最大池化层,步长为2,注意pad为1
  4. 与VGGNet不同的是,ResNet除了一个3x3的最大池化层,其他下采样全都是使用卷积层实现
    如上图,我们称INCEPTION resnet v2网络架构 resnet网络结构详解_机器学习_15INCEPTION resnet v2网络架构 resnet网络结构详解_权重_16INCEPTION resnet v2网络架构 resnet网络结构详解_卷积_17INCEPTION resnet v2网络架构 resnet网络结构详解_权重_18为四个卷积组,INCEPTION resnet v2网络架构 resnet网络结构详解_机器学习_15的下采样由最大池化层实现,其他三个卷积组的下采样,都是由邻接上一个卷积组的残差块实现
    与上一个卷积组邻接的残差块的结构(以ResNet-18/34为例)
  5. INCEPTION resnet v2网络架构 resnet网络结构详解_权重_20

  6. 其他残差块的结构(以ResNet-18/34为例)
  7. INCEPTION resnet v2网络架构 resnet网络结构详解_卷积_21