前言

本文介绍了什么是隐马尔科夫模型及其基本概念。

什么是隐马尔科夫

隐马尔科夫模型由初始概率分布、状态转移概率分布以及观测概率分布确定。隐马尔科夫模型λ可以用三元符号表示:

λ=(A,B,π)

其中 A,B,λ被称为隐马尔科夫模型的三要素。
此外,我们还有一些常见名词:
所有可能状态集合Q:

Q={q1,q2,...,qN}

所有可能观测集合V:

V={v1,v2,...,vN}

长度为T的状态序列I:

I=(i1,i2,...,iT)

与之对应的观测序列O:

O=(o1,o2,...,oT)

状态转移概率矩阵:

A=[aij]N∗N

其中

aij=P(it+1=qj|it=qi)

是在t时刻处于状态 qj的条件下在时刻t+1转移到状态 qj的概率。
观测概率矩阵B:

B=[bj(k)]N∗M

其中

bj(k)=P(ot=vk|it=qk)

是在t时刻处于状态 qj的条件下生成观测 vk的概率。


模型举例

假设有4个盒子,编号为A、B、C、D。每个盒子里面都装有红白两种颜色的球。

盒子

A

B

C

D

红球数

5

3

6

8

白球数

5

7

4

2

按照一定的方法抽球:从4个盒子里面以等概论随机选取一个盒子,从这个盒子里面随机抽取1个求,记录颜色后放回。然后再重新选取盒子,进行下一轮的抽取。每轮抽取的规则如下:
如果当前选取A盒子,那么下次必须选取B盒子;
如果当前选取B盒子,那么下次有0.4概率选取A盒子,0.6 概率选取C盒子;
如果当前选取C盒子,那么下次有0.4概率选取B盒子,0.6概率选取D盒子;
如果当前是D盒子,那么下次有0.5概率选取D盒子,0.5概率选取C盒子。

某次实验中,我们按照某种次序,依次从五个盒子里共抽取了,得到球的颜色顺序如下:{红,红,白,白,红}
(设计如此“复杂”的规则是为了后面清晰地表明矩阵的含义)

模型与例子的变量对应说明

“盒子”对应状态。本实验中,状态集合为:


Q={盒子A,盒子B,盒子C,盒子D}

“按照某种次序,依次从五个盒子里共抽取”明显地,我们不知道是按照哪种盒子次序抽取的,抽取盒子的序列是不可观测的,是

状态序列


I=(盒子X,盒子X,盒子X,盒子X,盒子X)

“球的颜色”对应观测。本实验中,

观测集合是:


V={红,白}

“抽取了五次,得到球的颜色顺序如下:{红,红,白,白,红}”对应

状态观测序列


O=(红,红,白,白,红)

”开始,从四个盒子

等概率选取一个盒子”对应

初始概率分布


π=(0.25,0.25,0.25,0.25)T

“如果当前选取XX盒子,那么下一个选取XX盒子”对应

状态转移概率


A=⎡⎣⎢⎢⎢00.400100.4000.600.5000.60.5⎤⎦⎥⎥⎥

Aij代表,从i盒子转移到j盒子,概率有多大


“每个盒子里各自的红白球数”对应

观测概率分布



B=⎡⎣⎢⎢⎢0.50.30.60.80.50.70.40.2⎤⎦⎥⎥⎥

Bij代表,第i盒子第j种球抽到的概率有多大

两个基本假设

  • 齐次马尔科夫性假设:假设隐藏的马尔科夫链在任意t时刻的状态只依赖于前一时刻的状态,与其他时刻的状态及观测无关。本实验中,抽取下个盒子X的概率只跟抽取前一个盒子X有关,与其他时刻抽取盒子和抽取的球颜色没有关系。
  • 观测独立性假设:假设任意时刻的观测只依赖于该时刻的马尔科夫链的状态,与其他观测及状态无关。在本实验中,抽取红球和白球的概率只与当前抽取的盒子有关,与其他抽取球的颜色和抽取的盒子无关。

后续

隐马尔科夫模型是关于时序的概率模型,描述由一个隐藏的马尔科夫链随机生成不可观测的状态序列,再由各个状态随机生成一个观测而产生观测序列的过程

如果你认真阅读了例子和对应关系,我相信能够比较清楚地理解什么是隐马尔科夫模型了。本人水平有限,如有任何表达不清或错误地方,欢迎各位朋友交流指正。