首页 | 本学科首页   官方微博 | 高级检索  
     

中文知识库问答中的路径选择
引用本文:吴锟,周夏冰,李正华,梁兴伟,陈文亮. 中文知识库问答中的路径选择[J]. 中文信息学报, 2021, 35(9): 113-122
作者姓名:吴锟  周夏冰  李正华  梁兴伟  陈文亮
作者单位:1.苏州大学 计算机科学与技术学院,江苏 苏州 215006;
2.康佳集团股份有限公司,广东 深圳 518000
基金项目:国家自然科学基金(61702518,61876116)
摘    要:路径选择是知识库问答任务的关键步骤,语义相似度常被用来计算路径对于问句的相似度得分。针对测试集中存在大量未见的关系,该文提出使用一种负例动态采样的语义相似度模型的训练方法,去丰富训练集中关系的多样性,模型性能得到显著提升。针对复杂问题候选路径数量组合爆炸问题,该文比较了两种路径剪枝方法,即基于分类的方法和基于集束搜索的方法。在包含简单问题和复杂问题的CCKS 2019-CKBQA评测数据集上,该方法能达到较优异的性能,测试集上单模型系统平均F1值达到0.694,系统融合后达到0.731。

关 键 词:知识库问答  BERT  动态采样  集束搜索  
收稿时间:2020-12-13

Path Selection for Chinese Knowledge Base Question Answering
WU Kun,ZHOU Xiabing,LI Zhenghua,LIANG Xingwei,CHEN Wenliang. Path Selection for Chinese Knowledge Base Question Answering[J]. Journal of Chinese Information Processing, 2021, 35(9): 113-122
Authors:WU Kun  ZHOU Xiabing  LI Zhenghua  LIANG Xingwei  CHEN Wenliang
Affiliation:1.School of Computer Science and Technology, Soochow University, Suzhou, Jiangsu 215006, China;2.Konka Group Co., Ltd, Shenzhen, Guangdong 518000, China
Abstract:Path selection, as a key step in the Knowledge Base Question Answering (KBQA) task, relies on the the semantic similarity between a question and candidate paths. To deal with massive unseen relations in the test set, a method based on dynamic sampling of negative examples is proposed to enrich the relations in the training set. In the prediction phase, two path pruning methods, i.e., the classification method and the beam search method, are compared to tackle the explosion of candidate paths. On the CCKS 2019-CKBQA evaluation data set containing simple and complex problems, the proposed method achieves an average F1 value of 0.694 for the single-model system, and 0.731 for the ensemble system.
Keywords:KBQA    BERT    dynamic sampling    beam search  
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号