F a s t   R − C N N Fast\ _{}R-CNN Fast RCNN

R o s s   G i r s h i c k Ross\ _{}Girshick Ross Girshick

  摘要:本文提出了一种基于快速区域的卷积网络方法(Fast R-CNN)进行目标检测。Fast R-CNN以先前的工作为基础,使用深度卷积网络对object proposals进行有效分类。与以前的工作相比,Fast R-CNN采用了多项创新,可以提高训练和测试速度,同时还可以提高检测精度。Fast R-CNN训练非常深的VGG16网络的速度比R-CNN快9倍,在测试时快213倍,并且在PASCAL VOC 2012上实现了更高的mAP。与SPPnet相比,Fast R-CNN训练VGG16的速度快了3倍,测试速度提高了10倍,并且更加准确。Fast R-CNN是使用Python和C ++(使用Caffe)实现的。

《Fast R-CNN》翻译_卷积神经网络

图1 Fast R-CNN架构。输入图像和多个感兴趣区域(RoI)被完全地输入到卷积网络中。每个RoI被合并到一个固定大小的特征映射中,然后通过全连接层(FC)映射到特征向量。该网络每个RoI有两个输出向量:softmax概率和每个类边界框回归偏移。该架构经过端到端的多任务训练。