Stanford Cars Datasets

斯坦福的IMDb数据集 数据分析_人工智能


  • Overview:
    Stanford Cars数据集简称CARS196,由斯坦福大学—人工智能实验室于2013年发布,主要用于细粒度分类任务。 数据集包含196中汽车类型的图像,16185张不同型号的汽车图片,其中8144张为训练集,8041张为测试集。每个类别的图像相当,其中分类基于汽车品牌、车型和年份,例如:2012特斯拉Model S、2012 BMW M3 coupe。
  • 斯坦福的IMDb数据集 数据分析_数据集_02


  • Download:

下载网址:https://ai.stanford.edu/~jkrause/cars/car_dataset.html
训练集图片下载:car_train.gz
测试集图片下载:car_test.gz
开发工具包devkit:car_devkit.gz
所有图片的tar文件:car_ims.gz
用于训练和测试的所有边框和标签:cars_annos_mat

斯坦福的IMDb数据集 数据分析_数据集_03

README提供了有关汽车196数据集的文件的描述:

  • cars_meta.mat:
    包含类名称的单元格数组,每个类一个。
  • cars_train_annos.mat:
    包含变量“ annotations”,它是长度为num_images的结构数组,其中每个元素都具有字段:
    bbox_x1:边界框的最小x值,以像素为单位
    bbox_x2:边界框的最大x值,以像素为单位
    bbox_y1:边界框的最小y值,以像素为单位
    bbox_y2:边界框的最大y值,以像素为单位
    class:图像所属类的id。
    fname:图像文件夹中的图像文件名。
    “ annotations”变量中包含我们想要的结构数据,包括标签、图像文件名以及图像边界框信息,因此我们只需处理annotations变量并从中提取我们想要的信息
  • cars_test_annos.mat:
    与cars_train_annos.mat相同,但未提供class字段。

提交文件格式:

  • 要提交的文件应该是.txt文件,第M行上为图像M的类别预测。 请注意,图像M对应于提供的注释文件中的第M个注释。 这种格式的文件示例是train_perfect_preds.txt。
  • devkit中包括一个用于评估训练准确性的脚本eval_train.m。 用法是:
    (in MATLAB)
    [accuracy,confusion_matrix] = eval_train('train_perfect_preds.txt')

假设训练预测和测试预测是相同的格式,那么你在训练预测时使用这种函数,在评估服务器下测试预测应该有很好的结果


  • Evaluation:

设置了评估服务器,按照deckit中包含有关提交格式的说明提交文件,即可评估。


  • Citation:

如果使用此数据集,引用以下论文:

3D Object Representations for Fine-Grained Categorization
Jonathan Krause, Michael Stark, Jia Deng, Li Fei-Fei
4th IEEE Workshop on 3D Representation and Recognition, at ICCV 2013 (3dRR-13). Sydney, Australia. Dec. 8, 2013.

注意:发布数量具有196个类别,比论文少一类,因为自发布以来已经对其进行了一些请理。数字应该或多或少具有可比性。