机器学习笔记之高斯混合模型——EM算法求解高斯混合模型【M步操作】
- 引言
- 回顾:EM算法求解高斯混合模型的E步操作
- EM算法M步操作
- 求解过程
引言
上一节介绍了使用EM算法求解高斯混合模型参数的E步操作,本节将继续介绍后续的M步操作。
回顾:EM算法求解高斯混合模型的E步操作
- 高斯混合模型引入隐变量后的表示结果如下:
表示隐变量选择具体某项离散参数的概率分布:
表示隐变量条件下,样本服从均值为,协方差为 的高斯分布: - 对应的联合概率分布表示如下:
其中表示 属于各高斯分布的概率组成的向量。数学符号表示如下:表示样本
属于离散常量
对应概率分布
的概率结果。
同理,表示属于各高斯分布的期望组成的向量。数学符号表示如下:表示
属于离散常量
对应概率分布
的期望信息。
表示属于各高斯分布的协方差组成的向量。数学符号表示如下:表示
属于离散常量
对应概率分布
的协方差信息。
- 关于隐变量的后验概率表示如下:
- 至此,E步操作表示如下:
令是关于的函数。即:
经过E步的求解过程,求得最终表示结果如下:
EM算法M步操作
重新观察E步结果:
- 其中部分表示如下:
具体指(共三项): - 部分表示如下:
具体指(共6项):
由于是上一次迭代得到的参数结果,是已知量;因此将中的项修正过来:
例如是的一个解,区别于对应的解。
实际上是由构成的量,它的结果不会对当前迭代步骤的最优值产生影响。因此,在这里将其缩写成。 - 由于本质上是样本所有可能属于的高斯分布组成的向量,即:
并且对应的分别表示如下:查看详情移步至
传送门
因此,分别表示如下:
基于上述公式,对进行变换:
我们以求解在当前时刻的最优解为例。上述式子中只有方括号内第一项包含,因此则有:
并且是概率结果,因此需要满足约束条件:
至此,求解的最优解即:
其中任意一项使用如下优化函数进行表示:
求解过程
使用拉格朗日乘数法进行求解:
- 构建拉格朗日函数:
- 拉格朗日函数对求偏导:
观察第一个连加号
,只有唯一一个
和
相关,其余均为常数;
- 令,等式两端同乘:
- 对,均进行求导并等于0,则有:
其中:条件概率密度积分~约束条件~
整理得:
因此,将带回原式,则有:
基于上式,可以求出
因而最终求解隐变量的后验概率分布结果:
同理,可求出其他隐变量的离散参数的迭代概率结果。
至此,高斯混合模型部分介绍结束。下一节将介绍隐马尔可夫模型推导过程本身不是重点,只需要知道‘高斯混合模型’可以使用‘狭义EM’直接求解即可。高斯混合模型作为最经典的‘概率生成模型’,它的‘生成模型思想’需要留意。