首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 93 毫秒
1.
问答系统应用于人工智能、自然语言处理和信息检索领域获得了较好的效果,知识图谱问答(KBQA)作为其中的重要组成部分,是一项极具挑战性的自然语言处理任务。然而,目前常见的中文KBQA系统对于实体链接的实体消歧部分并没有给出很好的解决方法。提出一种基于多特征实体消歧的中文KBQA系统,通过结合实体自身的知名度特征、问句与实体关系的语义相似度特征、问句与实体的字符相似度特征和语义相似度特征,构建多特征实体消歧模型,提高实体链接准确率,为系统的问句分类和最优路径选取部分提供更准确的主题实体,从而提升系统性能。实验结果表明,该系统在CCKS2019-CKBQA评测数据的验证集上平均F1值为72.08%,其中采用多特征消歧模型的实体链接准确率达到90.84%,较使用知名度消歧模型和评测大赛第1名分别提升6.35和0.11个百分点。  相似文献   

2.
近年来,中成药的使用和生产规模不断增大,产生了越来越多的中成药数据,中成药的普及与发展是一关键性问题。本项目结合知识图谱和多标签文本分类与命名实体识别的自然语言处理、语音识别等智能问答技术搭建中成药智能问答平台。在用户文本提问或语音提问后,平台会根据提问在海量中成药信息中迅速准确地查询相关中成药信息,并呈现相关中成药的知识图谱辅助用户理解。知识图谱可以将中成药很好的存储起来,智能问答可以帮助用户了解中成药,使用知识图谱结合智能问答技术对中成药普及与发展具有一定的意义。  相似文献   

3.
近年来,基于知识图谱的问答系统逐渐成为学术界和工业界的研究和应用热点方向,而传统方法通常存在效率不高以及未充分利用数据信息的问题。针对以上问题,本文将中文知识图谱问答分为实体抽取和属性选择2个子任务,采用双向长短期记忆条件随机场(Bi-LSTM-CRF)模型来进行实体识别,并提出一种多粒度特征表示的属性选择模型。该模型采用字符级别以及词级别分别对问句和属性进行嵌入表示并通过编码器进行编码,对于属性同时还引入热度编码的信息。通过不同粒度文本表示的结合,并对问句和属性进行相似度计算,最终该系统在NLPCC-ICCPOL 2016 KBQA数据集上取得了73.96%的F1值,能够较好地完成知识图谱问答任务。  相似文献   

4.
《软件》2018,(2):7-11
为提升用户获取生物学科相关知识的准确性和简洁性,设计并实现基于中文知识图谱的生物领域知识问答系统。针对生物学科领域实体的特殊性,基于改进的文档迁移距离算法结合逻辑回归模型实现实体链接;通过构建标注问题库并结合短文本相似度算法,实现问句语义理解。实验结果表明,系统对生物学科领域专有实体识别和问句语义理解两方面都具有较高的准确率,在生物学科领域问答应用中具有应用价值。  相似文献   

5.
为了提升现有急诊问答的速度,将医疗类专家知识、知识图谱和问答系统相结合,实现了通过自然语言人机交互 的急诊问答系统。本系统基于垂直类医疗网站,使用网络爬虫技术构建知识库,通过图数据库存储知识图谱;基于规则匹配方法和字符串匹配算法,构建领域词库对问句分类查询。本系统在急诊医疗领域知识图谱和问答系统构建中有应用价值。  相似文献   

6.
随着知识图谱的迅速发展,面向知识图谱的中文领域问答系统已成为目前最新最热的研究方向之一,对于提高专业领域服务智能化程度具有较高的意义和价值。针对中文口语语义表达多样化、不符合语法规范以及电商领域特殊性问题,提出一套流式的中文知识图谱自动问答系统CEQA,能够较好地完成电商领域商品咨询以及统计推理等复杂问题,特别是有效地提升了中英文混合商品名称识别、语义链接以及复杂问句的依存分析等方面的性能。实验结果表明,该系统在电商领域问答应用中具有较高的准确率和实用价值。  相似文献   

7.
问答系统可以增加用户获取信息的便捷度,而知识图谱作为结构化的数据来源,可以为问答系统提供更加高质量的知识,基于医学知识图谱的问答系统具有重要的研究和应用意义。该文针对成人中常见的原发性肝癌,从医学指南及SemMedDB知识库中抽取其知识三元组,构建了原发性肝癌的知识图谱。在此基础上,实现了流水线式的问答系统: 先识别问题中的实体,再结合TFIDF和词向量生成句子向量,匹配最相似的问题模板,根据模板的语义及问题中的实体,到知识图谱中检索答案。实验表明,该系统可以有效地回答原发性肝癌相关的药物、疾病及表征等问题。  相似文献   

8.
病虫害一直以来都是影响农作物生产的重要原因,在该领域构建基于知识图谱的问答系统有助于智慧农业的发展,是人工智能时代下农业信息化的重要举措.该研究针对专家内部作物病虫害数据,编写程序对其进行清洗、知识提取等操作,完成该领域的知识图谱构建任务.对病虫害文本进行序列标注,完成实体识别模型构建用于问句实体识别,并构建文本分类模型对问句进行意图识别,编写模版规则匹配可执行Cypher语句,从知识图谱中得到答案.结合Flask与React前后端分离的Web框架,最终形成完整的基于图谱的问答系统.  相似文献   

9.
针对当今社会人们因缺乏心理知识而导致心理疾病患病率急剧上升的问题,构建了一个小型的心理咨询知识图谱与问答系统(Question Answering system,QA)。该系统可以帮助咨询者及时获取心理知识,也可以识别出有自杀倾向的咨询者,防止危险发生。搜集了一些心理信息数据,通过构建字典并生成实体与关系构建了知识图谱;使用了HanLP(Han Language Processing)分词工具来生成关键词,通过CHI(Chi-square)特征选择来进行问题分类,提高问答效率;通过与其他模型对比,优选BiLSTM(Bi-directional Long Short-Term Memory)模型构建了自杀倾向文本分类器来检测危险的用户发言;通过计算相似度得分来进行问题模板匹配并生成答案。最后进行系统正确率测试,证明了该系统可以有效回答心理咨询相关的问题。  相似文献   

10.
11.
知识库问答任务是自然语言处理领域中的研究热点之一,目前国内外学者对知识库问答方法的研究大多数是基于英文数据,基于中文数据的研究非常少。由于中文存在语言多变性、语法不明确性、语言歧义性等特点,导致很多英文知识库问答研究方法很难应用于中文数据。针对以上问题,该文提出一种基于信息匹配的中文知识库问答研究方法,探索方法在中文数据上的效果。首先对问题进行主语实体识别和属性值识别;其次将问句中的实体链接到知识库中的实体,使用逻辑回归对候选实体进行筛选;再次抽取其两跳内关系作为候选查询路径,将候选查询路径和问题进行相似度匹配得到匹配度最高的候选路径;最后使用实体拼接来得到多实体情况的查询路径,查询知识库获得最终答案。该方法在CCKS2019 CKBQA测试集上的F值达到了75.6%。  相似文献   

12.
赵畅  李慧颖 《中文信息学报》2019,33(11):125-133
面向知识库问答的实体链接是指将自然语言问句中实体指称链接到知识库中实体的方法。目前主要面临两个问题: 第一是自然语言问句短,实体指称上下文不充分;第二是结构化知识库中实体的文本描述信息少。因此,该文提出了分别利用候选实体的类别、关系和邻近实体作为候选实体表示的方法,弥补知识库实体描述信息不足的问题。同时,通过语料训练得到问句指称的相似实体指称作为其背景知识。最后,结合实体流行度,共同作为实体消歧的特征。实验结果表明,上述提到所有特征的线性组合在数据集上高于单个特征的结果,表现最佳。  相似文献   

13.
传统自动问答方法通常依赖谓词等先验信息实现知识库问答,需要耗费较多的人力且泛化能力不佳.提出一种针对弱依赖信息的知识库问答方法,结合BERT与BiLSTM-CRF网络提取问句中的命名实体,定位知识库中与该实体相关的三元组信息,通过答案匹配网络为三元组集合中的答案标上相似度分数,使用阈值选择策略选取符合要求的答案集合,并...  相似文献   

14.
实体消歧和谓词匹配是中文知识库问答系统(CKBQA)中的两个核心任务。针对开放域知识库中实体和谓词数量巨大,且中文问句与知识库知识在表现形式上存在差异的问题,提出一种基于特征增强的BERT的流水线式问答系统(BERT-CKBQA),改进了上述两个子任务。采用BERT-CRF模型识别问句中提及的实体,得到候选实体集合。将问题和拼接谓词特征的候选实体输入BERT-CNN模型进行实体消歧。根据实体生成候选谓词集合,提出通过注意力机制引入答案实体谓词特征的BERT-BiLSTM-CNN模型进行谓词匹配。结合实体和谓词的得分确定查询路径来检索最终答案。该方法设计了一个中文简单问题的开放域知识库问答系统,引入预训练模型与谓词特征增强子任务特征以提升其性能,并在NLPCC-ICCPOL-2016KBQA数据集上取得了88.75%的平均F1值,提高了系统的回答准确率。  相似文献   

15.
基于知识图谱的问答中问句侯选主实体筛选步骤繁琐,且现有多数模型忽略了问句与关系的细粒度相关性。针对该问题,构建基于BiLSTM-CRF的细粒度知识图谱问答模型,其中包括实体识别和关系预测2个部分。在实体识别部分,利用BiLSTM-CRF模型提高准确性,并将N-Gram算法与Levenshtein距离算法相结合用于候选主实体的筛选,简化候选主实体筛选过程。在关系预测部分,分别应用注意力机制和卷积神经网络从语义层次和词层次捕获问句与关系之间的相互联系。使用FreeBase中的FB2M和FB5M评估数据集进行实验,结果表明,与针对单一关系的问答方法相比,该模型对于实体关系对的预测准确率更高。  相似文献   

16.
智能答疑系统中基于聚类的问题分类研究   总被引:3,自引:0,他引:3  
研究了智能答疑系统中的问题分类。针对基于章节目录的分类方式过于依赖特定教材的不足,提出了基于关键词聚类的问题模糊分类方法。此方法基于关键词的语义,采用NERF算法对关键词进行聚类。并利用聚类有效性的方法来弥补此算法过于依赖初始值的不足。最后通过实例进行分析,说明此分类方法的可行性和对基于章节目录的分类方式不足的弥补。  相似文献   

17.
受限领域问答系统的中文问句分析研究   总被引:1,自引:0,他引:1       下载免费PDF全文
对用户所提问句的理解是受限领域问答系统实现的关键,该文提出一种基于本体和问句句型模板规则的中文问句分析方法,研究如何使用问句语义表征来表示问句分析的结果,将该方法应用于某受限领域问答系统中。实验结果表明,使用该方法进行中文问句分析,准确率达90%以上,可以在实际的问答系统中使用该方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号