基于级联注意力与点监督机制的考场目标检测模型
- 1 全卷积单阶段目标检测模型
- 2 基于级联注意力与点监督机制的全卷积单级目标检测模型
- 2.1 级联注意力模块
- 2.2 点监督机制
1 全卷积单阶段目标检测模型
基于FCN(全卷积网络)的FCOS(全卷积单阶段目标检测模型)是本文的模型基础。FCOS采用的逐像素预测的方式, 使之适用于目标密集分布时的检测问题(比如考场的目标检测等).
图1,FCOS由骨干网络、特征金字塔模块和全卷积检测头三部分组成
- 着重介绍Head模块:包含分类与回归两大分支
- 分类:分类得分图和 Center-ness 热力图
- 回归,距离信息图
- 与传统模型需要使用IoU来计算筛选正样本不同,FCOS 将输入图像的所有像素都视为训练样本
2 基于级联注意力与点监督机制的全卷积单级目标检测模型
本文提出的方法是在FCOS上引入点监督分支及改进特征提取网络。
2.1 级联注意力模块
图4,为了整合不同尺度的感兴趣细节信息, 受级联思想启发, 我们利用级联结构把空间注意力机制和通道注 意力机制相结合, 得到级联注意力模块 CAM
该模块首先以骨干网络的特征图作为输入, 通过 空间注意力机制得到具有空间注意力的一级特征; 然后将该特征与原始输入特征图拼接并进行两次 1×1 卷积 操作, 得到二级特征; 重复该操作, 将二级特征再次与原始输入特征图拼接并卷积,得到三级特征; 最后, 对 一级特征、二级特征、三级特征进行拼接融合, 并将融合后的特征输入至通道注意力机制中, 抑制无用通道 进一步增强特征.
2.2 点监督机制
在Head模块中引入点监督分支PSM,更好地检测这些特征图中对应的交叠目标,更准确地定位并检测密集遮挡目标。
图5,首先计算目标包围框中各像素距其中心点 C 的距离, 计算该距离与目标框短边长度的比值, 得到归一化
距离, 取该距离小于(1−P)的所有像素形成中心点区域; 将中心点区域的标签置为 1, 其余区域置为 0; 最后,
使用 Binary Cross Entropy 损失函数监督训练该分支, 以增强特征图中的各目标中心点处的激活程度. 通过引
入该点监督机制, 能够使网络捕捉到目标的中心点及其附近的信息.