一种新的层次化结构问题分类器 |
| |
作者姓名: | 李方涛 张显 孙建树 朱小燕 |
| |
作者单位: | 清华大学 计算机科学技术系 智能技术与系统国家重点实验室,北京 100084 |
| |
基金项目: | 国家自然科学基金资助项目(60572084),863国家高技术研究发展计划资助项目(2006AA02Z321) |
| |
摘 要: | 问题分类是自动问答系统中关键技术之一,而问题中的关键词语是问题分类的重要依据。本文主要探讨问题词和中心词在问题分类中所起的作用,提出一种基于问题词和中心词的层次化结构问题分类器。分类器首先利用问题词将句子集分为三类,然后对于每个类别分别建立相应的分类器,对于what型问题,本文构造了基于关联规则的中心词分类器。本文实现的层次化结构分类器在TREC 2007 QA问题集和UIUC数据集上精度分别达到了90.6%和84.0%,充分显示了问题词和中心词在问题分类中至关重要的作用。
|
关 键 词: | 计算机应用 中文信息处理 问题分类 自动问答系统 问题词 中心词 |
文章编号: | 1003-0077(2008)01-0093-06 |
收稿时间: | 2007-05-31 |
修稿时间: | 2007-12-01 |
本文献已被 CNKI 维普 万方数据 等数据库收录! |
| 点击此处可从《中文信息学报》浏览原始摘要信息 |
|
点击此处可从《中文信息学报》下载全文 |
|