基于级联注意力与点监督机制的考场目标检测模型

  • 1 全卷积单阶段目标检测模型
  • 2 基于级联注意力与点监督机制的全卷积单级目标检测模型
  • 2.1 级联注意力模块
  • 2.2 点监督机制


1 全卷积单阶段目标检测模型

基于FCN(全卷积网络)的FCOS(全卷积单阶段目标检测模型)是本文的模型基础。FCOS采用的逐像素预测的方式, 使之适用于目标密集分布时的检测问题(比如考场的目标检测等).

小目标检测注意力_目标检测

图1,FCOS由骨干网络特征金字塔模块全卷积检测头三部分组成

  • 着重介绍Head模块:包含分类回归两大分支
  1. 分类:分类得分图和 Center-ness 热力图
  2. 回归,距离信息图
  • 与传统模型需要使用IoU来计算筛选正样本不同,FCOS 将输入图像的所有像素都视为训练样本

2 基于级联注意力与点监督机制的全卷积单级目标检测模型

小目标检测注意力_卷积_02

本文提出的方法是在FCOS上引入点监督分支及改进特征提取网络。

2.1 级联注意力模块

小目标检测注意力_计算机视觉_03

图4,为了整合不同尺度的感兴趣细节信息, 受级联思想启发, 我们利用级联结构把空间注意力机制和通道注 意力机制相结合, 得到级联注意力模块 CAM
该模块首先以骨干网络的特征图作为输入, 通过 空间注意力机制得到具有空间注意力的一级特征; 然后将该特征与原始输入特征图拼接并进行两次 1×1 卷积 操作, 得到二级特征; 重复该操作, 将二级特征再次与原始输入特征图拼接并卷积,得到三级特征; 最后, 对 一级特征、二级特征、三级特征进行拼接融合, 并将融合后的特征输入至通道注意力机制中, 抑制无用通道 进一步增强特征.

2.2 点监督机制

在Head模块中引入点监督分支PSM,更好地检测这些特征图中对应的交叠目标,更准确地定位并检测密集遮挡目标。

小目标检测注意力_深度学习_04

图5,首先计算目标包围框中各像素距其中心点 C 的距离, 计算该距离与目标框短边长度的比值, 得到归一化
距离, 取该距离小于(1−P)的所有像素形成中心点区域; 将中心点区域的标签置为 1, 其余区域置为 0; 最后,
使用 Binary Cross Entropy 损失函数监督训练该分支, 以增强特征图中的各目标中心点处的激活程度. 通过引
入该点监督机制, 能够使网络捕捉到目标的中心点及其附近的信息.