之前搜了一下最大似然分类,没有发现比较简单通俗的介绍,所以想写一篇容易看懂的来帮助大家理解。
在介绍最大似然分类之前,首先要明白什么是监督分类。所谓监督分类,就是通过部分训练样本的训练下,得到一个分类器(这里可以先理解为一个函数),这个分类器能够根据你输入的自变量值,得到一个因变量值,在分类问题中,这个因变量值是离散的。所以监督分类问题,解决的就是你输入一个x,它给你一个最可能的类别。
原理:基于贝叶斯公式推导
其中:
表示当像元值为X时X为i类的概率,
为像元值为X且为i类的概率,
为像元值为X的概率,
表示样本中某一类的概率,
表示i类中像元值为X的概率。这里
不能直接求,所以各类别
的和来求。
这里以遥感影像分类为例,进行最大似然法的介绍。
在遥感影像分类时,我们利用的是像元值(可能为多个波段的),假设现在分为4类(即n=4)。
样本选取:先通过人工标记得到各类别的样本,这里假设每种类别各30个样本,一共120个样本。
分类过程:
- 求。利用样本中i类别样本数除以总样本数,这里都为1/4。
- 求。这一步是核心,可以用多种方法,这里介绍正态分布。利用i类的样本求得均值与方差,然后利用均值与方差求得正态分布概率密度函数(维度与变量的个数有关,如3波段就是三维正态分布),将X代入概率密度函数即可得到的值。
- 有了上述两个值,根据公式求出该像元为各个类别的概率,然后通过比较得到最大概率对应的类别,即为该像元的类别。
算法其实就是这么简单,只需要具备一点基本的概率论知识便可以看懂,至于实现可以用matlab、python等,理解了算法后几十行代码就实现了。