首页 | 本学科首页   官方微博 | 高级检索  
     

一个改进的基于最大熵原理的汉语词性标注系统
引用本文:刘小可,王云兰.一个改进的基于最大熵原理的汉语词性标注系统[J].光盘技术,2007(6):17-18.
作者姓名:刘小可  王云兰
作者单位:1. 河南省科学技术情报研究所,河南,郑州,450003
2. 汝州市房地产管理处,河南,平顶山,467500
摘    要:本文研究了基于最大熵原理的汉语词性标注。文章采用了准确率增量驱动的上下文特征选取策略,而后采用EM算法量化了特征之间的相依程度,并将其作为概率特征引入到统一的特征表示框架;建模过程充分利用了语法词典中的知识,针对外部词汇构造了伪事件,并将词的候选词性限制在一个特定的子集内,有效缩减了词性标记的搜索范围。文章以北京大学人民日报标记语料作为试验数据,验证了该方法的有效性。

关 键 词:最大熵  特征选取  词典知识  汉语词性标注

An Improved Based on the Principle of Maxinum Entrogy of Speech Tagging System
LIU Xiao-ke,WANG Yun-Lan.An Improved Based on the Principle of Maxinum Entrogy of Speech Tagging System[J].CD Technology Magazine,2007(6):17-18.
Authors:LIU Xiao-ke  WANG Yun-Lan
Abstract:
Keywords:
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号