目录
——马尔可夫链
——隐马尔可夫链
——马尔可夫链
马尔科夫性质:即当前在已知时,过去和未来是独立的,如果知道当前的状态,那么就不许要过去的额外信息来对未来做出预测。
理解:n为n-1的后一个时间(或者说单位),若n-1为当前时刻状态,那么n即为下一刻的未来状态,0至n-1为先前的过去状态。满足上式说明:基于n-1刻(事件发生)背景下第n刻(事件发生)的概率与基于所有先前(事件发生)概率下第n刻(事件发生)的概率相等。通俗理解就是下一刻(n)事件的发生只与当前时刻(n-1)相关,与先前的时刻(0至n-1)无关。
马尔科夫链:满足马尔科夫性质的随机过程。
马尔科夫链用于计算事件发生——引例:
如果今天是sunny day,下一天是rainy day的概率为30%,仍然是sunny day的概率是70%。如果今天是rainy day,下一天是sunny day的概率为20%,仍然是rainy day的概率是80%。
引入数学分析,我们设S为状态空间。则S=[sunny day,rainy day],其中所有元素都是过程可以达到的所有可能状态。我们令今天的状态为S0,假如今天是sunny day,则S0=[1,0]。
设明天的状态是S1,那么从S0到S1就需要一个概率转移矩阵P,
就转移矩阵而言,表达两种状态相互转化信息,所以维度2*2,转化如下。
S1=S0*P
S2=S1*P= S0*P*P=S0*P2
…
Sn=S0*Pn
离散时间的马尔科夫链:是指变化发生在特点的状态之中。
状态:马尔科夫链在离散时间的值称为状态。
稳态马尔可夫链:马尔可夫链可以是静止的,因此与过程中的初始状态无关。这种现象也称为稳态马尔可夫链,稳态马尔科夫链必须是时间同质的,即概率转移矩阵不会时刻n的不同而不同。
实例:
在将马尔可夫链应用于股市预测中。状态空间为:
S=[Bull markets, Bear markets, Stagnant markets]
其状态间的转移概率为:
当前周的状态向量为:C=[0,1,0],可计算未来n周股市市场的概率。
结果表明:
1、当n趋于无穷大时,概率会收敛到一个稳定状态,称为稳态概率。
2、实验表明,稳态概率不受初始状态的影响
"""
Author:小堂同学
Time:2022.8.21
"""
import numpy as np
# 经典马尔可夫模型
def classic_markov(ini_state,transition_matrix,K):
"""
:param ini_state: 初始状态
:param transition_matrix: 转移矩阵
:param K: 预测后K个单位
:return:
"""
ini_state = np.mat(ini_state)
transition_matrix = np.mat(transition_matrix)
if ini_state.shape[1] != transition_matrix.shape[0] \
or transition_matrix.shape[0] != transition_matrix.shape[1]:
return False
return ini_state @ np.linalg.matrix_power(transition_matrix,K)
ini_state = [0,1,0]
t = [[0.9,0.075,0.025],[0.15,0.8,0.05],[0.25,0.25,0.5]]
print(classic_markov(ini_state,t,1))
print(classic_markov(ini_state,t,5))
print(classic_markov(ini_state,t,52))
print(classic_markov(ini_state,t,99))
ini_state = [1,0,0]
print(classic_markov(ini_state,t,99))
——隐马尔可夫链
"""
Author:小堂同学
Time:2022.8.21
"""
import sys
import numpy as np
class Hidden_Markov:
def __init__(self,
state_space,
state_transition_matrix,
observe_probability_matrix,
ini_probability_vector,
observe_dict,
observe_list):
self.Q = state_space # 状态集合
self.A = np.mat(state_transition_matrix) # 状态转移矩阵
self.B = np.mat(observe_probability_matrix) # 观测概率矩阵
self.C = ini_probability_vector # 初始状态概率向量
self.V = dict(observe_dict) # 观测集合,字典类型
self.N = len(state_space) # 状态总数
self.M = len(observe_dict) # 观测集合总数
if len(state_space) != self.A.shape[0] or \
self.A.shape[0] != self.A.shape[1] or \
self.B.shape[0] != len(state_space) or \
self.B.shape[1] != len(observe_dict):
print("输入数据有错!")
sys.exit()
self.O = observe_list # 观测序列
def forward(self):
ini_value = [round(self.C[i] * self.B[i,self.V[self.O[0]]],4)
for i in range(self.N)]
ls = ini_value
for t in range(1,len(self.O)):
ls = [
sum([ls[j] * self.A[j,i] for j in range(self.N)]) * \
self.B[i,self.V[self.O[t]]]
for i in range(self.N)
]
return round(sum(ls),5)
def back(self):
b = [1 for i in range(self.N)]
T = [i for i in range(1,len(self.O))]
T.reverse() # 产生T-1至1
for t in T:
b = [
sum([self.A[i,j] * self.B[j,self.V[self.O[t]]] * b[j] for j in range(self.N)])
for i in range(self.N)
]
return round(sum(
[self.C[i] * self.B[i,self.V[self.O[0]]] * b[i]
for i in range(self.N)]
),5)
def prediction(self):
f = []
F = []
f1 = [round(self.C[i] * self.B[i,self.V[self.O[0]]],4) for i in range(self.N)]
F1 = [0 for i in range(self.N)]
f.append(f1)
F.append(F1)
for t in range(1,len(self.O)):
temp_f = [round(
max([f[t-1][j] * self.A[j,i] for j in range(self.N)]) * self.B[i,self.V[self.O[t]]]
,5)
for i in range(self.N)]
f.append(temp_f)
temp_F = []
for i in range(self.N):
ls = [f[t-1][j] * self.A[j,i] * self.B[i,self.V[self.O[t]]] for j in range(self.N)]
temp_F.append(ls.index(max(ls))+1)
F.append(temp_F)
P = max(f[-1])
prediction =[]
sta = f[-1].index(P)+1
prediction.append(sta)
for t in range(1,len(self.O)):
temp_sta = F[-t][prediction[t-1]-1]
prediction.append(temp_sta)
prediction.reverse()
return prediction
if __name__ == "__main__":
Q = [1,2,3]
V = {"红":0,
"白":1}
C = [0.2,0.4,0.4]
A = [[0.5,0.2,0.3],
[0.3,0.5,0.2],
[0.2,0.3,0.5]]
B = [[0.5,0.5],
[0.4,0.6],
[0.7,0.3]]
O = ["红","白","红"]
HMM = Hidden_Markov(Q,A,B,C,V,O)
print(HMM.forward())
print(HMM.back())
print(HMM.prediction())
浅薄之见,敬请指正!
共勉!