概率图模型之间的关系
概率图模型
这篇文章主要想总结一下朴素贝叶斯、最大熵、隐马尔可夫和条件随机场这四个概率图模型之间的一些联系与区别。
模型类型
从模型类型上来说,朴素贝叶斯和隐马尔可夫都是生成模型,采用生成式方法进行标签生成;最大熵和条件随机场是判别模型,通过将各种特征组合在一起判断标签。
朴素贝叶斯和最大熵
这两个模型都是为了学习条件概率,朴素贝叶斯是最大化后验概率,而最大熵是最大化条件熵。
最大熵和条件随机场
将整个序列标注看作分类问题,如果序列 $y$ 的长度有$n$个,并且序列上的元素共有 $m$ 种状态, 那么这个类别一共有 $m^n$ 个。
每次只考虑一项,一个个预测过去,但是失去了序列中元素的前后顺序关系。
条件随机场的做法是在子序列上定义特征并计算子序列得分,比如 $y_{i-1}, y_i$,这样也就 $m^2$