引言简介

目前深度学习应用日趋广泛,而卷积神经网络(CNN)作为一种针对图像处理及其有效的网络框架在图像分类领域表现出了良好的性能与准确率。但是对于高光谱图像分类问题CNN也出现了一些问题。
它们主要包括:

1.同一类别的像素可能具有不同的光谱特征,不同类别的像素又可能具有相同的光谱特征,因此仅利用光谱特征很难区分不同像素代表的类别。
2.不能利用高光谱图像当中充足的空间信息与光谱信息。
3.不能充分利用特定像素周围丰富的语义上下文属性,造成大量信息的丢失。

因此,这篇文章提出了一种网络结构,这种网络架构基本结构由CNN组成,它将原图像分为六个patch,分别为全局,上、下、左、右以及中央,这六个区域对应的patch分别对应一种网络结构,这六个CNN分支组成的框架再进行特征提取之后进行全连接操作,最后利用softmax输出分类结果。其网络结构如下图所示:

lstm和cnn用于图片分类_lstm和cnn用于图片分类


这种网络结构针对高光谱图像分类的主要优点有:

1.使用不同区域的联合表示可以同时利用每个像素的光谱信息、空间结构信息和语义上下文感知信息。

2.设计了一个重要的模块“多尺度求和”,用于深度特征提取,可以将多个尺度和不同层次的特征从不等层中组合起来,保证了信息的完备性。

DRCNN的网络结构

DRCNN 的网络结构主要由六个不同patch的CNN分支构成,其主要问题在于如何选取邻接区域,由于要充分利用不同像素周围的上下文信息,因此将像素周围分别在全局,上、下、左、右以及中央取11x11、11x7、11x7、7x11、7x11、3x3的patch(如下图所示)

lstm和cnn用于图片分类_lstm和cnn用于图片分类_02

然后送入六个CNN模块中进行特征提取。此外,为了防止训练数据量小二而导致的过拟合问题,还提出了一种multi-scale summation的模块作为除中央区域外其他区域的特征提取器,其结构如下图所示

lstm和cnn用于图片分类_高光谱图像分类_03


而对于中央区域,则使用不同的CNN架构来进行特征提取如下提图

lstm和cnn用于图片分类_人工智能_04


其中在进行第一次卷积操作之后会首先进行一次批归一化BN操作来提高运算速度。

lstm和cnn用于图片分类_lstm和cnn用于图片分类_05


其激活函数使用ReLU函数。

lstm和cnn用于图片分类_人工智能_06

数据增强

由于高光谱图像分类所用到的训练数据较少,容易造成过拟合问题,因此需要运用一些数据增强手段来增加样本数量以达到提高模型准确度防止过拟合的问题。本文中使用了在图像中添加高斯噪声的方式来增加样本数据的数量,如下图所示

lstm和cnn用于图片分类_深度学习_07

实验

本文针对该网络模型的实验主要在三个数据集上进行,分别是 IndianPines 、 Salinas以及the University of Pavia数据集。

首先针对于不同的window的大小对应的准确率进行了实验。

lstm和cnn用于图片分类_人工智能_08


发现针对于窗口大小而言,11x11大小的窗口准确率更高,因此使用如下的分区patch进行训练

lstm和cnn用于图片分类_高光谱图像分类_09


这里以Pavia数据集为例,实验表明DRCNN的分类准确率在各个类上的表现基本好于其他方法

**

lstm和cnn用于图片分类_人工智能_10


lstm和cnn用于图片分类_lstm和cnn用于图片分类_11

几个问题

lstm和cnn用于图片分类_高光谱图像分类_12


lstm和cnn用于图片分类_lstm和cnn用于图片分类_13


lstm和cnn用于图片分类_高光谱图像分类_14


lstm和cnn用于图片分类_卷积神经网络_15