RNN自然语言处理 hmm自然语言处理

转载

烂漫树林 2024-05-10 14:46:12

由隐状态序列，生成可观测状态的过程。
两个基本假设：

RNN自然语言处理 hmm自然语言处理_RNN自然语言处理

RNN自然语言处理 hmm自然语言处理_自然语言处理_02

RNN自然语言处理 hmm自然语言处理_hmm_03

RNN自然语言处理 hmm自然语言处理_状态转移_04

RNN自然语言处理 hmm自然语言处理_状态转移_05

RNN自然语言处理 hmm自然语言处理_状态转移_06

建立两个Table，第一个存储当前时刻落在每种隐状态的最大概率；第二个Table存储对应T1中每个隐状态最大概率是从上一时刻哪个隐状态转移过来。规格都是𝑛𝑢𝑚_ℎ𝑖𝑑𝑑𝑒𝑛_𝑠𝑡𝑎𝑡𝑒𝑠∗𝑠𝑒𝑞𝑢𝑒𝑛𝑐𝑒_𝑙𝑒𝑛𝑔𝑡ℎ 。
用初始隐状态矩阵的每个元素和发射矩阵初始时刻对应字符（此时为v0）的列的每个元素相乘，得到0时刻的T1,T2。

RNN自然语言处理 hmm自然语言处理_状态转移_07

RNN自然语言处理 hmm自然语言处理_维特比算法_08

在之后1时刻，（此时对应字符为v1）要计算落入当前隐状态的最大概率，就要分别计算前一时刻不同隐状态转移到当前隐状态后生成当前时刻字符的概率，取最大值，写入T1，并且在T2中记录对应路径。这就是之前的单步贪婪算法。重复步骤，填完表格。

RNN自然语言处理 hmm自然语言处理_自然语言处理_09

最后由T1表格的最后一列的最大值，得到最后一步的最优隐状态，然后向前回溯，依据就是T2表格记录的值，每次根据找到的当前最优隐状态，在T2中当前时刻对应的行（即前一时刻的最优隐状态），找到前一时刻的最优隐状态，重复找完即可。
其实还有方便的矩阵运算方法，这样方便编程实现，具体如下。并且还要注意要把矩阵元素取对数，这样乘变加，不会因为太小而变成0.

RNN自然语言处理 hmm自然语言处理_维特比算法_10