基于深度神经网络的高光谱影响分类方法研究
装备学院学报
遥感影像分类的问题:预处理复杂,高维特征提取困难,分类不够精确等缺陷
首先采用最大噪声分数来降低特征空间维度,然后将自动编码器与softmax多想逻辑回归分类器组合成含有多隐藏层的神经网络,对高光谱影像进行非监督型深度特征提取与分类。
0、引言
高光谱影像分类问题:低空间分辨率导致混合像元现象、波段间高相似性导致Hughes现象、端元与光谱不对应导致数据结构高度非线性等原因,使得高光谱影像数据一致都是具有挑战性的热点问题
监督学习、半监督学习、非监督学习
但是监督学习会面临下面的问题:
1.实际问题中标签数据稀缺,难以方便获得
2.求解高度非凸优化问题时会存在大量局部极值
3.使用梯度下降法时会发生弥散问题
非监督多隐藏层的自动编码器深度神经网络算法
1.MNF方法和自动编码器基本原理
1.1 MNF方法
不同波段下的高光谱影像组合成一个数据立方体,每一幅影像中像元记录的是对应瞬时视场(IFOV)内地物的辐射信息,每个像元在不同波段中的辐射信息组成了一个连续光谱曲线。
为什么在数据处理之前通常对数据维度做一些预处理呢?
在狭长的带宽中存在数百个频带,且相邻频带之间具有高相关性,导致了信息冗余与高维数据处理困难等问题,还会产生Hughes现象。
因此在分类之前需要对高光谱影像进行降维预处理,即对高维度影像信息用低维数据数据来简单表征,在降低数据量的同时优化地物的特征提取。
MNF(最小噪声分离变换,在ENVI中可以实现的操作)变化实现降维,基本原理是通过正交线性变换将所有波段的数投影到新的特征空间中是彼此互不相关,并按照个影像质量由大到小排列各成分,影像质量的衡量标准是信噪比。
1.2 自动编码器
无监督学习目的就是让输出y接近输入x,可以模拟x,注意没有标签的,只是让输出y代替输入x。
2.算法设计
增加隐藏层层数显然要比直接增加隐藏层神经元数量更加有效。
特征提取:
输入
设计网络 激活函数
损失函数 交叉熵损失代价函数 优化器
BP反向传播 更新权重
自动编码器最后一层输出,即对原始输入数据最高阶的特征表达
分类器:
Softmax回归模型 (根据所给的样本值来推断属于某一类的概率)
步骤:
1.MNF变化
2.初始化参数
3.训练自动编码器
4.softmax分类
5.BP网络调整权重参数(我发现BP网络就是附带反向传播算法的网络,通常在自动编码器最后设置一层,但是就目前主流的cnn而言,是不存在这个问题,在框架中直接使用卷积神经网络)
3.实验结果
3.1 实验测试集
Indian Pines
Pavia
3.2 实验结果与分析
0.2用于训练,0.8测试
Indian Pines :1个输入层、2个隐藏层、一个输出层。
180 120、120 16
Lr=0.05
预训练80次,微调200次?(这个怎么调次数?)
Pavia: 1个输入层、4个隐藏层、 1个输出层
90 70、70、70、70 9
Lr=0.05
预训练80次,微调200次
平均分类准确率:(这个算是很低了)
90.54%,88.44%