基于规则的中文阅读理解问题回答技术研究 |
| |
作者姓名: | 李济洪 杨杏丽 王瑞波 张娜 李国臣 |
| |
作者单位: | 1.山西大学 计算中心,山西 太原 030006; 2. 山西大学 数学科学学院,山西 太原 030006;3. 山西大学 计算机与信息技术学院,山西 太原 030006 |
| |
基金项目: | 国家自然科学基金,国家社会科学基金青年资助项目 |
| |
摘 要: | 该文针对中文阅读理解问答中的时间、人物、地点、数值、实体、描述六类问题,制定了各类问题回答的启发式规则集。对规则集中每条规则赋予一个相应权值,利用正交表对各规则所对应的权值进行了调优选取,给出了各候选答案句基于相应规则的得分计算方法。该文方法在山西大学自主开发的中文阅读理解语料库CRCC v1.1 上进行了实验,在整个语料库上得到了83.09%的HumSent准确率。为了与文献[10]中的最大熵方法比较,该文在与文献[10]中完全相同的训练集上调优规则的权值,在相同的测试集上测试,最终得到HumSent准确率81.13%,比最大熵的方法高大约1%, 且在全部的六类问题上,该文方法的HumSent准确率都不低于最大熵方法。
|
关 键 词: | 计算机应用 中文信息处理 阅读理解 问答系统 规则 正交表 |
本文献已被 CNKI 万方数据 等数据库收录! |
| 点击此处可从《中文信息学报》浏览原始摘要信息 |
|
点击此处可从《中文信息学报》下载全文 |
|