首页 | 本学科首页   官方微博 | 高级检索  
     

基于知识图谱、TF-IDF和BERT模型的冬奥知识问答系统
作者姓名:罗玲1  2  李硕凯1  2  何清1  2  杨骋骐2  王宇洋恒2  陈天宇2
作者单位:1. 中国科学院计算技术研究所 智能信息处理重点实验室,北京 100190;2. 中国科学院大学,北京 100049
摘    要:传统信息检索技术已经不能满足人们对信息获取效率的要求,智能问答系统应运而生,并成为自然语言处理领域一个非常重要的研究热点。本文针对中文的冬奥问答领域,提出了基于知识图谱、词频-逆文本频率指数 (term frequency-inverse document frequency,TF-IDF)和自注意力机制的双向编码表示(bidirectional encoder representation from transformers,BERT)的3种冬奥问答系统模型。本文首次构建了冬奥问答数据集,并将上述3种方法集成在一起,应用于冬奥问答领域,用户可以使用本系统来快速准确地获取冬奥内容相关的问答知识。进一步,对3种模型的效果进行了测评,测量了3种模型各自的回答可接受率。实验结果显示BERT模型的整体效果略优于知识图谱和TDIDF模型,BERT模型对3类问题的回答可接受率都超过了96%,知识图谱和TDIDF模型对于复合统计问答对的回答效果不如BERT模型。

关 键 词:智能问答  冬奥问答  对话模型  知识图谱  TF-IDF  BERT
点击此处可从《智能系统学报》浏览原始摘要信息
点击此处可从《智能系统学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号