1. Basic Defination

概率图模型,构造该模型的目的是为方便表达变量间的概率相关关系。概率图模型大致可以分为两类:“有向无环”的贝叶斯网络和“无向图”马尔科夫网。我们常说的马尔科夫链,其实是有方向的贝叶斯网络。在时间序列中其方向表示时间的推进。之所以称之为“隐”马尔科夫链,是因为我们能获取的信息是马尔科夫链上的各个Node是观测值,而实际上,我们假设每个Node是状态变量,变量空间是N个可能的离散取值;同时在每个Node上的观测值依赖于该状态变量,其取值可以是离散或连续的。
马尔科夫链, 其某一时刻的状态变量仅与上一时刻相关(无记忆性,构造该特性的目的是为了简化复杂的现实模型)。马尔科夫链的组成元素包括状态变量空间、观测变量空间以及:

  1. 状态转移概率, 状态转移矩阵是一个的矩阵
  2. 输出观测值概率
  3. 初始状态概率,即在初始时刻各状态出现的概率 其中

马尔科夫链的应用

  1. 根据模型参数()推测观测,根据历史的观测值,预测未来的观测值。比如根据历史时间序列,预测将来的时间序列。
  2. 根据模型参数()以及观测值推测状态变量。比如语音识别任务中,将语音认为是观测,文本认为是状态变量。
  3. 给定观测值x, 推测模型参数()。

2. 马尔科夫随机场

Plus 马尔科夫链中的经典问题

Gambler’s ruin problem, A gambler, at each play of the game: Probability of winning 1$, probability of losing 1$. At the beign, he has i$. Question: The probability that fortune will reach N before reaching 0.
  对于马氏链上的Node,我们定义状态为时间n下该赌徒的财富,基于该状态可以定义状态转移概率,我们有。同时, 有。 我们用表示从i美刀,到能取得N财富的概率,则可以建立递推关系:

  该式子等价于:, 递推,两边求和,且,可以得到的公式。
  或者,该问题可以使用Recurent, Transient来解释,在该赌博问题中i = 1….N-1为Transient状态,而i = 1或N 为Recurent状态。根据从

  故,有:

Reference:
周志华《机器学习》