之前搜了一下最大似然分类,没有发现比较简单通俗的介绍,所以想写一篇容易看懂的来帮助大家理解。

在介绍最大似然分类之前,首先要明白什么是监督分类。所谓监督分类,就是通过部分训练样本的训练下,得到一个分类器(这里可以先理解为一个函数),这个分类器能够根据你输入的自变量值,得到一个因变量值,在分类问题中,这个因变量值是离散的。所以监督分类问题,解决的就是你输入一个x,它给你一个最可能的类别。

原理:基于贝叶斯公式推导

 

python 最大似然发对图像进行分类 最大似然分类原理_正态分布

其中:

python 最大似然发对图像进行分类 最大似然分类原理_算法_02

表示当像元值为X时X为i类的概率,

python 最大似然发对图像进行分类 最大似然分类原理_python 最大似然发对图像进行分类_03

为像元值为X且为i类的概率,

python 最大似然发对图像进行分类 最大似然分类原理_算法_04

为像元值为X的概率,

python 最大似然发对图像进行分类 最大似然分类原理_遥感图像分类_05

表示样本中某一类的概率,

python 最大似然发对图像进行分类 最大似然分类原理_python 最大似然发对图像进行分类_06

表示i类中像元值为X的概率。这里

python 最大似然发对图像进行分类 最大似然分类原理_算法_04

不能直接求,所以各类别

python 最大似然发对图像进行分类 最大似然分类原理_python 最大似然发对图像进行分类_06

的和来求。

这里以遥感影像分类为例,进行最大似然法的介绍。

在遥感影像分类时,我们利用的是像元值(可能为多个波段的),假设现在分为4类(即n=4)。

样本选取:先通过人工标记得到各类别的样本,这里假设每种类别各30个样本,一共120个样本。

分类过程:

  1. 求。利用样本中i类别样本数除以总样本数,这里都为1/4。
  2. 求。这一步是核心,可以用多种方法,这里介绍正态分布。利用i类的样本求得均值与方差,然后利用均值与方差求得正态分布概率密度函数(维度与变量的个数有关,如3波段就是三维正态分布),将X代入概率密度函数即可得到的值。
  3. 有了上述两个值,根据公式求出该像元为各个类别的概率,然后通过比较得到最大概率对应的类别,即为该像元的类别。

算法其实就是这么简单,只需要具备一点基本的概率论知识便可以看懂,至于实现可以用matlab、python等,理解了算法后几十行代码就实现了。