首页 | 本学科首页   官方微博 | 高级检索  
     

基于特征选择和最大熵模型的汉语词义消歧
引用本文:何径舟,王厚峰.基于特征选择和最大熵模型的汉语词义消歧[J].软件学报,2010,21(6):1287-1295.
作者姓名:何径舟  王厚峰
作者单位:北京大学,信息科学技术学院,计算语言学研究所,北京,100871;北京大学,计算语言学教育部重点实验室,北京,100871
基金项目:upported by the National Natural Science Foundation of China under Grant Nos.60675035, 60973053, 90920011 (国家自然科学基金); the Beijing Municipal Natural Science Foundation of China under Grant No.4072012 (北京市自然科学基金)
摘    要:词义消歧是自然语言处理中一类典型的分类问题.在分类中,特征的选择至关重要.通常情况下,特征是由人工选择的,这就要求特征选取者对于待分类的问题本身和分类模型的特点有深刻的认识.分析了汉语词义消岐中特征模板对消歧结果的影响,在此基础上提出一套基于最大熵分类模型的自动特征选择方法,包括针对所有歧义词的统一特征模板选择和针对单个歧义词的独立特征模板优化算法.实验结果表明,使用自动选择的特征,不仅简化了特征模板,而且提高了汉语词义消歧的性能.与SemEval 2007:task #5的最好成绩相比,该方法分别在微平均值MicroAve(micro-average accuracy))和宏平均值MacroAve(macro-average accuracy))上提升了3.10%和2.96%.

关 键 词:最大熵模型  分类特征  自动特征选择  汉语词义消歧
修稿时间:2009/2/24 0:00:00

Chinese Word Sense Disambiguation Based on Maximum Entropy Model with Feature Selection
HE Jing-Zhou and WANG Hou-Feng.Chinese Word Sense Disambiguation Based on Maximum Entropy Model with Feature Selection[J].Journal of Software,2010,21(6):1287-1295.
Authors:HE Jing-Zhou and WANG Hou-Feng
Abstract:
Keywords:maximum entropy model  classification feature  automatic feature selection  Chinese word sense disambiguation
本文献已被 万方数据 等数据库收录!
点击此处可从《软件学报》浏览原始摘要信息
点击此处可从《软件学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号