首页 | 本学科首页   官方微博 | 高级检索  
     

基于统计和规则的常用词的兼类识别研究
引用本文:夏静,柴玉梅,昝红英.基于统计和规则的常用词的兼类识别研究[J].计算机工程与设计,2013,34(2):654-659.
作者姓名:夏静  柴玉梅  昝红英
作者单位:郑州大学信息工程学院,河南郑州,450001
基金项目:国家自然科学基金项目(60970083);模式识别国家重点实验室开放课题基金项目;河南省科技创新人才杰出青年基金项目(104100510026)
摘    要:词的兼类问题是汉语词性标注中的关键问题之一.针对常用词的兼类识别进行研究,综合考虑了影响兼类词识别的不同特征,分别使用条件随机场模型、最大熵模型和k最近邻等统计方法,根据兼类词本身的特点以及其在上下文句子中的关系,同时针对不同的方法采用词语信息、词性信息等不同的特征模板分别对训练语料进行特征抽取,并取得了较好的实验结果;对一些识别结果不够理想的词又尝试了规则的方法,构建兼类词的规则,不断进行测试,改进规则库,在相同的条件下,得到了优于统计方法的实验结果.

关 键 词:中文信息处理  兼类词  条件随机场  最大熵  K近邻

Study on multi-category of common words based on statistics and rules
XIA Jing , CHAI Yu-mei , ZAN Hong-ying.Study on multi-category of common words based on statistics and rules[J].Computer Engineering and Design,2013,34(2):654-659.
Authors:XIA Jing  CHAI Yu-mei  ZAN Hong-ying
Affiliation:(College of Information Engineering,Zhengzhou University,Zhengzhou 450001,China)
Abstract:
Keywords:
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号