对正负样本的选择

1.ssd:设置一个阈值(0.5),大于这个阈值的框为正样本,其它框作为负样本鉴定为背景。但是负样本还是远大于正样本,因此采用了难样本挖掘。难样本挖掘的具体操作是计算出所以负样本的损失进行排序,选取损失较大的TOP-K个负样本,这里的K设为正样本数量的3倍。在Faster-RCNN中是通过限制正负样本的数量来保证样本均衡,SDD则采用了限制正负样本的比例。对于留下的预测框执行NMS算法,过滤掉那些重叠度较大的预测框。最后剩余的预测框就是检测结果了。

2.fast rcnn:一个mini-batch中正负样本的比例按照1:3选取,且与groundtruth的IoU>=0.5的为正样本,0.1<IoU<0.5的为负样本.

3.faster rcnn有两次选择正负样本的操作,一次发生在RPN部分,RPN可以产生(提出)大约20,000个框,其中大量的框都是无目标的背景,因此要进行选择平衡的正负样本用于训练RPN。在训练了RPN后,我们训练rcnn,先通过RPN产生大约20,000个预测框,通过对前景概率排序,NMS等系列操作,得到了2000个候选框,与上述的fast rcnn 相同,这2000个候选框也不是全部用于训练,于是出现第二次样本选择。

rcnn的正负样本选择
2000个候选框不是都拿去训练,而是利用选择128个用以训练。选择过程如下:
候选框和gt_bboxes 的IoU大于0.5的,选择一些作为正样本(选取32个)。
其余样本为负样本。(96个)

RPN的正负样本选择
RPN将20000多个候选的anchor选出256个anchor进行分类和回归位置。选择过程如下:
对于每一个ground truth bounding box(gt_bbox),选择和它重叠度(IoU)最高的一个anchor作为正样本。
对于剩下的anchor,从中选择和任意一个gt_bbox重叠度超过0.7的anchor,作为正样本,正样本的数目不超过128个。
随机选择和gt_bbox重叠度小于0.3的anchor作为负样本。负样本和正样本的总数为256。

yolov1:正样本:对应的cell中有物体中心,与GT有最大IOU的b-box。        负样本其余b-box。

yolov2-3:v2-v3中引入了anchor,每个网格单元有3个anchor,但是只有和gt的iou最大的anchor才负责预测gt,计算loss,但是由于v2中的边界框其实比v1多,此时定了一个iou阈值,anchor和gt的iou小于iou阈值的才是负样本,如果在iou阈值和最大iou之间的样本均作为忽略样本.
 

 参考文献:rcnn系列论文、ssd论文、yolo系列论文。