首页 | 官方网站   微博 | 高级检索  
     

基于汉语框架网的中文问题分类
引用本文:李茹,宋小香,王文晶.基于汉语框架网的中文问题分类[J].计算机工程与应用,2009,45(31):111-114.
作者姓名:李茹  宋小香  王文晶
作者单位:1.山西大学 计算机与信息技术学院,太原 030006 ;2.山西大学 计算智能与中文信息处理教育部重点实验室,太原 030006
基金项目:国家高技术研究发展计划(863),国家社会科学基金青年项目,山西省高等学校拔尖人才基金,山西省实验室开放基金,太原市科技明星项目,山西省大学生创新性实验计划项目 
摘    要:问题分类是问答系统中重要的组成部分,问题分类结果的准确性直接影响到问答系统的质量。基于汉语框架网(Chinese FrameNet,CFN)提出了一种用于中文问题分类的新方法。该方法通过构建一系列汉语框架语义特征来表达每个问句的语义信息,进而使用最大熵模型进行中文问题的自动分类,与传统的问题分类技术相比,汉语框架语义信息的加入使得中文问题分类的精度得到了显著提高。实验结果进一步验证了该方法的有效性,大类和小类的分类精度分别达到了91.38%和83.20%。

关 键 词:汉语框架网  问题分类  最大熵模型
收稿时间:2009-5-18
修稿时间:2009-6-18  

Chinese question classification based on Chinese FrameNet
LI Ru,SONG Xiao-xiang,WANG Wen-jing.Chinese question classification based on Chinese FrameNet[J].Computer Engineering and Applications,2009,45(31):111-114.
Authors:LI Ru  SONG Xiao-xiang  WANG Wen-jing
Affiliation:1.School of Computer &; Information Technology,Shanxi University,Taiyuan 030006,China 2.Computer Intelligent and Chinese Information Processing of the Ministry Education Key Laboratory Built Together by Province and Department,Taiyuan 030006,China
Abstract:Question classification is very important for question answering,and its accuracy affects the performance of the question answering system.This paper introduces a method of Chinese question classification based on Chinese FrameNet(CFN).In this method,a series of features are firstly constructed to express each question s semantic information,and then Maximum Entropy Model is used to implement question classifier.Compared to the traditional methods,semantic information of Chinese FrameNet can improve the performance of question classification significantly.The experiment result shows that this method is effective and the classification accuracy of coarse classes and fine classes achieves 91.38% and 83.20% respectively.
Keywords:Chinese FrameNet  question classification  maximum entropy model
本文献已被 维普 万方数据 等数据库收录!
点击此处可从《计算机工程与应用》浏览原始摘要信息
点击此处可从《计算机工程与应用》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号