首页 | 本学科首页   官方微博 | 高级检索  
     

基于知网的中文问题自动分类
引用本文:孙景广,蔡东风,吕德新,董燕举.基于知网的中文问题自动分类[J].中文信息学报,2007,21(1):90-95.
作者姓名:孙景广  蔡东风  吕德新  董燕举
作者单位:沈阳航空工业学院 自然语言处理研究室,辽宁 沈阳110034
基金项目:航空科研项目;辽宁省自然科学基金
摘    要:问答系统应能用准确、简洁的答案回答用户用自然语言提出的问题。问题分类是问答系统所要处理的第一步,分类结果的正确率直接影响后续工作的进行。本文提出了一种使用知网作为语义资源选取分类特征,并使用最大熵模型进行分类的新方法。该方法以问题的疑问词、句法结构、疑问意向词、疑问意向词在知网中的首义原作为分类特征。实验结果表明,在知网中选取的首义原能很好的表达问题焦点词的语义信息,可作为问题分类的一个主要特征。该方法能显著地提高问题分类的精度,大类和小类的分类精度分别达到了92.18%和83.86%。

关 键 词:计算机应用  中文信息处理  问答系统  问题分类  知网  最大熵模型  分类特征  
文章编号:1003-0077(2007)01-0090-06
收稿时间:2006-07-30
修稿时间:2006-10-12

HowNet Based Chinese Question Automatic Classification
SUN Jing-guang,CAI Dong-feng,LV De-xin,DONG Yan-ju.HowNet Based Chinese Question Automatic Classification[J].Journal of Chinese Information Processing,2007,21(1):90-95.
Authors:SUN Jing-guang  CAI Dong-feng  LV De-xin  DONG Yan-ju
Affiliation:Natural Language Processing Laboratory,Shengyang Institute of Aeronautical Engineering,
Shenyang,Liaoning 110034, China
Abstract:Question answering system can provides a precise and concise answer to a natural language query.Question classification is the first task of Question Answering System,and the precision of question classification has great effect on the subsequent processes.In this paper,we present a new method on feature extraction which uses HowNet as semantic resource,and use Maximum Entropy Model to realize it.We choose the interrogative words,syntax structure,question focus words and their first sememes as classification feature.The experiment result show that the first sememes in HowNet can express the main meaning of the question focus words,it can be as an important feature.This method can improve the precision of question classification: the classification precision of coarse classes and fine classes reaches 92.18% and 83.86% respectively.
Keywords:computer application  Chinese information processing  question answering system  question classification  HowNet  maximum entropy model  classification feature
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号