首页 | 本学科首页   官方微博 | 高级检索  
     

多分类器集成的汉语词义消歧研究
引用本文:吴云芳,王淼,金澎,俞士汶.多分类器集成的汉语词义消歧研究[J].计算机研究与发展,2008,45(8).
作者姓名:吴云芳  王淼  金澎  俞士汶
作者单位:北京大学信息科学技术学院,北京,100871
基金项目:国家自然科学基金,国家社会科学基金,国家高技术研究发展计划(863计划),国家重点基础研究发展计划(973计划)
摘    要:词义消歧长期以来一直是自然语言处理中的热点和难题,集成方法被认为是机器学习研究的四大趋势之一.系统研究了9种集成学习方法在汉语词义消歧中的应用.9种集成方法分别是乘法规则、均值、最大值、最小值、多数投票、序列投票、加权投票、概率加权和单分类器融合,其中乘法规则、均值、最大值3种集成方法还未曾应用于词义消歧.选取支持向量机模型、朴素贝叶斯和决策树作为3个单分类器.在两个不同的数据集上进行了实验,其一是选自现代汉语语义标注语料库的18个多义词,其二是国际语义评测SemEval-2007的中英文对译选择词消歧任务.实验结果显示,首次在词义消歧中引入应用的3种集成方法乘法、均值、最大值有良好的性能表现,3种方法的消歧准确率均高于最佳单分类器SVM,而且优于其他6种集成方法.

关 键 词:词义消歧  多分类器集成  均值  最大值

Ensembles of Classifiers for Chinese Word Sense Disambiguation
Wu Yunfang,Wang Miao,Jin Peng,Yu Shiwen.Ensembles of Classifiers for Chinese Word Sense Disambiguation[J].Journal of Computer Research and Development,2008,45(8).
Authors:Wu Yunfang  Wang Miao  Jin Peng  Yu Shiwen
Affiliation:Wu Yunfang1,Wang Miao2,Jin Peng1,, Yu Shiwen11(School of Electronic Engineering , Computer Science,Peking University,Beijing 100871)2(School of Software , Microelectronics,Beijing 102600)
Abstract:Word sense disambiguation has long been a central concern for natural language processing,and ensemble of classifiers is one of the four current directions in machine learning study.This paper makes a systematic study on the ensembles of classifiers for Chinese word sense disambiguation.Nine kinds of combining strategies are experimented in this paper:product,average,max,min,majority voting,rank-based voting,weighted voting,weighted probability,and best single combining,among which the three combining metho...
Keywords:word sense disambiguation  ensemble of classifiers  average  max  
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号