基于小样本学习的图像分类和目标检测研究小样本分类算法

转载

mob64ca1416f1ef 2024-04-25 13:20:15

文章标签 基于小样本学习的图像分类和目标检测研究 sed 数据集泛化 文章分类 计算机视觉人工智能

【论文阅读】【元学习/小样本学习】【ICLR2020】CROSS-DOMAIN FEW-SHOT CLASSIFICATION VIA LEARNED FEATURE-WISE TRANSFORMATION

Few-Shot Classification
Metric-Based Approach
Meta-Learning Setting
Problem formulation and motivation：Cross-Domain Few-Shot Classification
FEATURE-WISE TRANSFORMATION LAYER
LEARNING THE FEATURE-WISE TRANSFORMATION LAYERS
实验
参考文献

基于小样本学习的图像分类和目标检测研究小样本分类算法_基于小样本学习的图像分类和目标检测研究

Few-Shot Classification

小样本分类问题通常描述为N-ways K-shots问题（下图描述的就是3-ways 3-shots问题）。核心思想是利用Support set中N个类别、每个类别K个样本的有标签小样本数据对Query set中的无标签样本进行分类。

基于小样本学习的图像分类和目标检测研究小样本分类算法_数据集_02

Metric-Based Approach

基于度量的方法包含一个Feature encoder和一个Metric function。首先同时对support set中的有标签小样本和query set中的无标签样本提取feature，之后使用Metric funtion对query set中的样本进行分类。

基于小样本学习的图像分类和目标检测研究小样本分类算法_sed_03

不同基于度量的方法在Metric Function的设计上不同。

Meta-Learning Setting

基于小样本学习的图像分类和目标检测研究小样本分类算法_泛化_04

Problem formulation and motivation：Cross-Domain Few-Shot Classification

在ICLR2019的文章中，假设meta-training的domain是mini-ImageNet，1）如果meta-testing的domain还是mini-ImageNet，则在5-shot的分类任务上，准确率在70%以上；2）如果meta-testing的domain是CUB（更加细粒度的分类），则在5-shot的分类任务上，准确率在50%左右。

基于小样本学习的图像分类和目标检测研究小样本分类算法_基于小样本学习的图像分类和目标检测研究_05

上述问题出现的原因是因为两个domain的特征分布不同，Metric function不能够泛化到新的特征分布上。（As a result, during the training stage, the metric function may overfit to the feature distributions encoded only from the seen domains and thus fail to generalize to unseen domains.
）

我的理解是，mini-ImageNet是一个粗粒度的分类数据集，而CUB是一种细粒度的分类数据集。在meta-training阶段，我们的目的是拉大类间距离（比如鸟类和美食类），而鸟类又包含了各种鸟，我们没有关注细粒度类间距离。在meta-testing阶段，使用CUB数据集导致我们提取的特征都聚集在bird类附近，但各种鸟类之间距离没有通过训练来增大。

基于小样本学习的图像分类和目标检测研究小样本分类算法_数据集_06

基于小样本学习的图像分类和目标检测研究小样本分类算法_基于小样本学习的图像分类和目标检测研究_07

基于小样本学习的图像分类和目标检测研究小样本分类算法_数据集_08

mete-testing阶段特征分布和meta-training阶段不同（通常是由于meta-training和meta-testing数据来自不同数据集导致的，但是每一个task的support set和query set的数据来自同一个domain数据集）。

FEATURE-WISE TRANSFORMATION LAYER

由于seen和unseen domain中task数据特征分布的差异性，metric function $基于小样本学习的图像分类和目标检测研究小样本分类算法_数据集_09$

核心思想是diversify feature distribution。在训练阶段利用仿射变换增强图像的特征，模拟不同domain下的各种特征分布，从而提高Metric function $基于小样本学习的图像分类和目标检测研究小样本分类算法_数据集_09$ 的泛化能力。

基于小样本学习的图像分类和目标检测研究小样本分类算法_泛化_11

基于小样本学习的图像分类和目标检测研究小样本分类算法_基于小样本学习的图像分类和目标检测研究_12

基于小样本学习的图像分类和目标检测研究小样本分类算法_数据集_13

基于小样本学习的图像分类和目标检测研究小样本分类算法_数据集_14

具体做法是在特征提取器 $基于小样本学习的图像分类和目标检测研究小样本分类算法_sed_15$ 中增加feature-wise transformation layer，该转换层利用由超参数θγ和θβ参数化的高斯分布采样的缩放项 $基于小样本学习的图像分类和目标检测研究小样本分类算法_sed_16$ 和偏差项 $基于小样本学习的图像分类和目标检测研究小样本分类算法_泛化_17$ ,来改变中间特征激活z。

基于小样本学习的图像分类和目标检测研究小样本分类算法_sed_18

基于小样本学习的图像分类和目标检测研究小样本分类算法_基于小样本学习的图像分类和目标检测研究_19

基于小样本学习的图像分类和目标检测研究小样本分类算法_sed_20

基于小样本学习的图像分类和目标检测研究小样本分类算法_sed_21

LEARNING THE FEATURE-WISE TRANSFORMATION LAYERS

凭经验选择超参数 $基于小样本学习的图像分类和目标检测研究小样本分类算法_基于小样本学习的图像分类和目标检测研究_22$ 是有困难的。作者提出了一种learning-to-learn的方法来选择超参数。
当前模型在Pseudo-unseen domain上的表现体现的是该模型在其他domain上的泛化能力。Learning to Generalize的核心思想是通过优化参数 $基于小样本学习的图像分类和目标检测研究小样本分类算法_基于小样本学习的图像分类和目标检测研究_23$ 来提升当前模型在unseen domain上的表现。The core idea is that training the metric-based model integrated with the proposed layers on the seen domains should improve the performance of the model on the unseen domains.

为什么不在Pseudo-seen domain上更新参数 $基于小样本学习的图像分类和目标检测研究小样本分类算法_基于小样本学习的图像分类和目标检测研究_23$ ？
因为 $基于小样本学习的图像分类和目标检测研究小样本分类算法_基于小样本学习的图像分类和目标检测研究_23$ 不是用来减小分类误差的，而是为了diversify the feature distribution，从而提高模型在其他domain上的分类精度，所以应该用该模型在其他domain上的分类误差来更新 $基于小样本学习的图像分类和目标检测研究小样本分类算法_基于小样本学习的图像分类和目标检测研究_23$ 。

这里有点类似MAML，参数的更新是为了减小在其他分类任务中使用该参数作为初始参数的模型的分类误差。

基于小样本学习的图像分类和目标检测研究小样本分类算法_泛化_27

基于小样本学习的图像分类和目标检测研究小样本分类算法_数据集_28

存在二阶导，消耗GPU memory

基于小样本学习的图像分类和目标检测研究小样本分类算法_基于小样本学习的图像分类和目标检测研究_29

基于小样本学习的图像分类和目标检测研究小样本分类算法_基于小样本学习的图像分类和目标检测研究_30

在每个训练的iteration $基于小样本学习的图像分类和目标检测研究小样本分类算法_泛化_31$ 上，从一系列seen domains上采样了一个pseudo-seen domain 和一个pseudo-unseen domain 。给定一个metric-based 模型，其Feature Encoder为 $基于小样本学习的图像分类和目标检测研究小样本分类算法_基于小样本学习的图像分类和目标检测研究_32$ ，其Metric Function为 $基于小样本学习的图像分类和目标检测研究小样本分类算法_泛化_33$ 。首先将超参数为 $基于小样本学习的图像分类和目标检测研究小样本分类算法_基于小样本学习的图像分类和目标检测研究_34$ 的变换层插入到Feature Encoder$E_{\theta_e^t} 中，使用 pseudo-seen task 更新metric-based 模型里的参数，如公式(5)所示。

基于小样本学习的图像分类和目标检测研究小样本分类算法_基于小样本学习的图像分类和目标检测研究_35

然后使用更新的模型来测试generalization性能。首先，移除模型里的特征变换层，然后使用pseudo-unseen task 来计算分类损失，用来更新特征变换层的参数。如公式(6)和公式(7)所示。

基于小样本学习的图像分类和目标检测研究小样本分类算法_泛化_36

基于小样本学习的图像分类和目标检测研究小样本分类算法_sed_37

实验

两种实验设置：

基于小样本学习的图像分类和目标检测研究小样本分类算法_sed_38

凭经验预决定超参数 $基于小样本学习的图像分类和目标检测研究小样本分类算法_基于小样本学习的图像分类和目标检测研究_39$ ，并且分析feature-wise transformation layers的影响。在mini-ImageNet domain 上meta-trainging模型，在其余四个CUB、Cars、Places、Plantae domain上meta-testing。
分析learning-to-learn的作用。使用leave-one-out 留一法策略：从CUB、Cars、Places、Plantae四个domain上选择一个作为unseen domain，其余三个和mini-ImagNet一起作为seen domain用来训练模型。

backbone：ResNet-10

Pre-trained feature encoder：预训练feature encoder $基于小样本学习的图像分类和目标检测研究小样本分类算法_sed_15$ ，最小化mini-ImageNet 64分类问题的standard cross-entropy classification loss。

Table 1：hand-tuned

feature-wise transformation 没有使用learning-to-learn，凭经验选择参数

基于小样本学习的图像分类和目标检测研究小样本分类算法_数据集_41

Table 2：train on multiple training sets, test on one set ,LFT指使用了learning-to-learn

基于小样本学习的图像分类和目标检测研究小样本分类算法_数据集_42

visualization of feature space：

基于小样本学习的图像分类和目标检测研究小样本分类算法_基于小样本学习的图像分类和目标检测研究_07

LFT的重要性：

基于小样本学习的图像分类和目标检测研究小样本分类算法_sed_44

不同深度的block、不同method的参数 $基于小样本学习的图像分类和目标检测研究小样本分类算法_基于小样本学习的图像分类和目标检测研究_23$ 不同，所以应该使用LFT。

参考文献

DataTalks #28: Cross-Domain Few-Shot Classification

Project

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

上一篇：搭建express框架 express框架使用

下一篇：adam训练resnet adams review

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯