目标检测之常用数据集
我们在利用模型检测实际应用问题的时候,通常需要使用自己标注和收集数据集来进行训练。
但对于不同算法性能的比较,我们常常需要一些基本的数据集来进行横向对比。
下列是一些常用的目标检测数据集:
- PASCAL VOC
- ImageNet
- COCO
1.PASCAL VOC challange
PASCAL VOC挑战在2005年至2012年间展开。
PASCAL VOC 2007:9963张图像,24640个标注。
PASCAL VOC 2012: 11530张图像,27450个标注。
该数据集中有20个分类,同时包含11530张用于训练和验证的图像,其中感兴趣区域有27450个标定目标,每个图像平均有2.4个目标。
以下是数据集中的20个分类:
Person(人):person(人)
Animal(动物):bird(鸟)、cat(猫)、cow(牛)、dog(狗)、horse(马)、sheep(羊)
Vehicle(车辆):aeroplane(飞机)、bicycle(自行车)、boat(船)、bus(巴士)、car(汽车)、motorbike(摩托车)、train(火车)
indoor(室内):bottle(瓶)、chair(椅子)、dining table(餐桌)、potted plant(盆栽植物)、sofa(沙发)、tv(电视)/monitor(监视器)
链接:http://host.robots.ox.ac.uk/pascal/VOC/voc2012/
2 ImageNet数据集
ILSVRC 2010-2017为斯坦福大学的李飞飞教授主导并组建的数据集。
- ImageNet拥有用于分类、定位和检测任务评估的数据
- 与分类数据类似,定位任务有1000个类别。准确率是根据Top 5检测结果计算出来的。
- 对200个目标的检测问题有470000个图像,平均每个图像有1.1个目标。
3 MS COCO数据集
MS COCO的全称是Microsoft Common Objects in Context,起源于微软于2014年出资标注的Microsoft COCO数据集,与ImageNet竞赛一样,被视为计算机视觉领域最受关注和最权威的比赛之一。
在ImageNet竞赛停办后,COCO竞赛就成为是当前目标识别、检测等领域的一个最权威、最重要的标杆,也是目标该领域在国际上唯一能汇集Google、微软、Facebook以及国内外众多顶尖院校和优秀创新企业公共参与的大赛。
COCO(Common Objects in Context)数据集包含20万个图像:11.5万多训练集验证集图像,2万多张测试集图像。
80个类别中有超过50万个目标标注。他是最广泛公开的目标检测数据集。
平均每个图像的目标数为7.2个。
Talk is cheap. Show me the code