首页 | 本学科首页   官方微博 | 高级检索  
     

最大熵和HMM在中文词性标注中的应用
引用本文:余昕聪,李红莲,吕学强.最大熵和HMM在中文词性标注中的应用[J].无线互联科技,2014(11):122-124.
作者姓名:余昕聪  李红莲  吕学强
作者单位:北京信息科技大学;
摘    要:隐马尔可夫模型(HMM)基于n-元语法的标注效果虽然不错,但由于预测信息的不足,对汉语的词性标注,特别是未登录词的词性标注精度影响很大。而最大熵模型使用特征的形式,有效的利用了上下文信息,在一定的约束条件下可以得到与训练数据一致的概率分布,即使是未登录词,由于其丰富的上下文信息,对它的词性标注也起到了很好的预测作用。实验结果证明最大熵方法取得了较好的标注效果。

关 键 词:隐马尔科夫模型(HMM)  最大熵模型  未登录词  汉语的词性标注
本文献已被 CNKI 维普 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号