首页 | 本学科首页   官方微博 | 高级检索  
     

问题分类中基于句法和语义信息的特征选择
引用本文:袁晓洁,师建兴,宁华,于士涛.问题分类中基于句法和语义信息的特征选择[J].计算机工程与应用,2008,44(33):144-147.
作者姓名:袁晓洁  师建兴  宁华  于士涛
作者单位:南开大学,信息技术科学学院,天津,300071
基金项目:微软亚洲研究院互联网服务科研基金
摘    要:问题分类是问答系统中一个非常重要的子模块,其关键在于问题的特征选择。考虑了问题的句法信息和语义信息,提出了一种利用问题疑问词、依存关系、主要动词、中心名词和名词的最高上位词作为特征进行分类的新方法。实验中,采用k-最邻近和朴素贝叶斯两种分类算法对该方法进行测试,结果表明了该方法具有较好的分类效果。在自定义的分类体系上,分别达到了82.2%和83.7%的分类精度,性能高于基于bag-of-words的特征选择方法。

关 键 词:问答系统  问题分类  特征选择  依存关系  上位词
收稿时间:2007-12-17
修稿时间:2008-3-7  

Feature selection using syntactic and semantic information in question classification
YUAN Xiao-jie,SHI Jian-xing,NING Hua,YU Shi-tao.Feature selection using syntactic and semantic information in question classification[J].Computer Engineering and Applications,2008,44(33):144-147.
Authors:YUAN Xiao-jie  SHI Jian-xing  NING Hua  YU Shi-tao
Affiliation:College of Information Technical Science,Nankai University,Tianjin 300071,China
Abstract:Question classification is a very important sub-module of question answering system,and the key lies in the feature selection.This paper proposes a new feature selection method based on syntactic and semantic information,using the question word,the main verb of the question,the dependency structure,the main noun and the top hypernym of the noun as features for classification.Evaluate the effect of feature selection using KNN and Nave Bayes classifiers,and attain an expected result.In the predefined question taxonomy,the classification accurate reaches 82.2% and 83.7% respectively.It is better than the method using bag-of-words features.
Keywords:question answering system  question classification  feature selection  dependency structure  hypernym
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《计算机工程与应用》浏览原始摘要信息
点击此处可从《计算机工程与应用》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号