机器学习笔记之高斯混合模型——EM算法求解高斯混合模型【M步操作】
- 引言
- 回顾:EM算法求解高斯混合模型的E步操作
- EM算法M步操作
- 求解过程
引言
上一节介绍了使用EM算法求解高斯混合模型参数的E步操作,本节将继续介绍后续的M步操作。
回顾:EM算法求解高斯混合模型的E步操作
- 高斯混合模型
引入隐变量
后的表示结果如下:
表示隐变量
选择具体某项离散参数
的概率分布:
表示隐变量
条件下,样本
服从均值为
,协方差为
的高斯分布:
- 对应的联合概率分布
表示如下:
其中表示
属于各高斯分布的概率组成的向量。数学符号表示如下:
表示样本
属于离散常量
对应概率分布
的概率结果。
同理,表示
属于各高斯分布的期望组成的向量。数学符号表示如下:
表示
属于离散常量
对应概率分布
的期望信息。
表示
属于各高斯分布的协方差组成的向量。数学符号表示如下:
表示
属于离散常量
对应概率分布
的协方差信息。
- 关于隐变量的后验概率
表示如下:
- 至此,E步操作表示如下:
令是关于
的函数。即:
经过E步的求解过程,求得最终表示结果如下:
EM算法M步操作
重新观察E步结果:
- 其中
部分表示如下:
具体指(共三项):
部分表示如下:
具体指(共6项):
由于是上一次迭代得到的参数结果,是已知量;因此将
中的
项修正过来:
例如是
的一个解,区别于对应
的解
。
实际上是由
构成的量,它的结果不会对当前迭代步骤
的最优值产生影响。因此,在这里将其缩写成
。
- 由于
本质上是样本
所有可能属于的高斯分布组成的向量,即:
并且对应的分别表示如下:
查看详情移步至
传送门
因此,分别表示如下:
基于上述公式,对进行变换:
我们以求解在当前时刻的最优解
为例。上述式子中只有方括号内第一项包含
,因此则有:
并且是概率结果,因此
需要满足约束条件:
至此,求解的最优解
即:
其中任意一项使用如下优化函数进行表示:
求解过程
使用拉格朗日乘数法进行求解:
- 构建拉格朗日函数
:
- 拉格朗日函数
对
求偏导:
观察第一个连加号
,只有唯一一个
和
相关,其余均为常数;
- 令
,等式两端同乘
:
- 对
,均进行求导并等于0,则有:
其中:条件概率密度积分~约束条件~
整理得:
因此,将带回原式,则有:
基于上式,可以求出
因而最终求解隐变量的后验概率分布结果
:
同理,可求出其他隐变量的离散参数的迭代概率结果。
至此,高斯混合模型部分介绍结束。下一节将介绍隐马尔可夫模型推导过程本身不是重点,只需要知道‘高斯混合模型’可以使用‘狭义EM’直接求解即可。高斯混合模型作为最经典的‘概率生成模型’,它的‘生成模型思想’需要留意。