最大熵和HMM在中文词性标注中的应用 |
| |
引用本文: | 余昕聪,李红莲,吕学强.最大熵和HMM在中文词性标注中的应用[J].无线互联科技,2014(11):122-124. |
| |
作者姓名: | 余昕聪 李红莲 吕学强 |
| |
作者单位: | 北京信息科技大学; |
| |
摘 要: | 隐马尔可夫模型(HMM)基于n-元语法的标注效果虽然不错,但由于预测信息的不足,对汉语的词性标注,特别是未登录词的词性标注精度影响很大。而最大熵模型使用特征的形式,有效的利用了上下文信息,在一定的约束条件下可以得到与训练数据一致的概率分布,即使是未登录词,由于其丰富的上下文信息,对它的词性标注也起到了很好的预测作用。实验结果证明最大熵方法取得了较好的标注效果。
|
关 键 词: | 隐马尔科夫模型(HMM) 最大熵模型 未登录词 汉语的词性标注 |
本文献已被 CNKI 维普 等数据库收录! |
|