首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
基于BERT的心血管医疗指南实体关系抽取方法   总被引:1,自引:0,他引:1  
武小平  张强  赵芳  焦琳 《计算机应用》2021,41(1):145-149
实体关系抽取是医疗领域知识问答、知识图谱构建及信息抽取的重要基础环节之一。针对在心血管专病知识图谱构建的过程中尚无公开数据集可用的情况,收集了心血管疾病领域的医疗指南并进行相应的实体和关系类别的专业标注,构建了心血管专病知识图谱实体关系抽取的专业数据集。基于该数据集,首先提出双向变形编码器卷积神经网络(BERT-CNN)模型以实现中文语料中的关系抽取,然后根据中文语义中主要以词而不是字为基本单位的特性,提出了改进的基于全词掩模的双向变形编码器卷积神经网络(BERT(wwm)-CNN)模型用于提升在中文语料中关系抽取的性能。实验结果表明,改进的BERT(wwm)-CNN在所构建的关系抽取数据集上准确率达到0.85,召回率达到0.80,F1值达到0.83,优于对比的基于双向变形编码器长短期记忆网络(BERT-LSTM)模型和BERT-CNN模型,验证了改进网络模型的优势。  相似文献   

2.
徐进 《计算机科学》2021,48(z1):285-288
在新时代智能制造的背景下,传统的工业装配设计方法已经无法满足现代用户追求智能、高效、高精的需求,推进工业设计的智能化成为目前工业领域研究的热点之一.文章通过在现有的工业装配设计方法上,开展面向装配设计图谱的构建,通过装配设计规范构建了装配设计本体模型,从三维图面档案中零件数据获取、零件实体的识别、零件间关系的抽取以及零件知识的融合等方向入手,将获取到的装配数据存入图数据库中构建以汽车发动机领域为例的工业装配知识图谱.实验结果验证了装配设计图谱的可行性.  相似文献   

3.
多模态知识图谱(multi-modal knowledge graph, MMKG)是近几年新兴的人工智能领域研究热点.本文提供了一种多模态领域知识图谱的构建方法,以解决计算机学科领域知识体系庞大分散的问题.首先,通过爬取计算机学科的相关多模态数据,构建了一个系统化的多模态知识图谱.但构建多模态知识图谱需要耗费大量的人力物力,本文训练了基于LEBERT模型和关系抽取规则的实体-关系联合抽取模型,最终实现了一个能够自动抽取关系三元组的多模态计算机学科领域知识图谱.  相似文献   

4.
当今电厂面临着诸多挑战,包括电力设备种类繁多、设备数量庞大、故障类型众多、数据耦合关系复杂以及海量的故障信息数据等。知识图谱能够将各种信息整合、可视化呈现,并支持智能化应用,有助于人们更好地获取、管理和应用知识,从而提高效率、创造价值。运用知识图谱来分析电厂故障数据,有助于深入研究电厂设备故障情况。在构建知识图谱的过程中,关系抽取是关键步骤之一,其准确率直接影响最终知识图谱构建的质量。本文提出了一个面向电厂关键发电设备故障知识图谱构建的关系抽取工具,该工具能将故障信息中海量、异构的数据以及相关故障处理进行可视化表达,同时支持用户交互式地参与到关系抽取的过程中,通过迭代训练来优化关系抽取模型。在实验测试阶段,利用真实电厂设备故障数据进行验证,证明了该工具在显著提高关系抽取的准确率方面的有效性。因此,构建的知识图谱质量得以提升,为电厂管理人员更好地运维管理发电设备提供了重要支持,为管控电厂相关数据以及推动电厂完备建设提供有力支撑。  相似文献   

5.
风险领域实体关系抽取是扩充现有知识图谱与泛化知识工程应用的关键问题.当前特定领域实体关系抽取面临人工标注语料的严重依赖、实体间关系的交叉互联以及远程监督标注存在噪声数据等核心难题,简单的解决方案是运用风险领域已有的知识图谱作为指导.然而,相比通用领域知识图谱,风险领域知识图谱的规模往往较小,难以满足当前领域实体关系抽取的知识需求.因此,本文既要利用已有的风险领域知识图谱,又要充分挖掘蕴含于领域文本数据中规律性的风险知识.本文提出基于知识图谱与文本互注意力的风险领域实体关系抽取方案.首先,根据已有的知识图谱抽象出风险领域实体关系及其约束条件;其次,运用少量高质的实体关系与大规模风险领域语料训练知识图谱与文本的互注意力机制模型,并融合文本表示学习与深度神经网络的方法进行风险领域实体关系的抽取.最后,针对给定的领域文本数据,综合关系约束与关系抽取结果得出风险领域实体关系类型.本文以风险领域数据为例,仅用少量的领域知识,即可获取较好的实体关系抽取效果.  相似文献   

6.
鉴于现有农业知识图谱对病虫害防治相关实体、关系刻画不够细致的问题,以苹果病虫害知识图谱构建为例,研究细粒度农业知识图谱的构建方法。对苹果病虫害知识的实体类型和关系种类进行细粒度定义,共划分出19种实体类别和22种实体关系,以此为基础标注并构建了苹果病虫害知识图谱数据集AppleKG。使用APD-CA模型对苹果病虫害领域命名实体进行识别,使用ED-ARE模型对实体关系进行抽取。实验结果表明,该文模型在命名实体识别和关系抽取两项子任务中的F1值分别达到了93.08%和94.73%。使用Neo4j数据库对知识图谱进行了存储和可视化,并就细粒度苹果病虫害知识图谱可以为精准病虫害信息查询、智能辅助诊断等下游任务提供底层技术支撑进行了讨论。  相似文献   

7.
领域知识对于构造领域知识间的知识图谱具有重大意义,然而互联网数据数量大、类型多样、内容丰富、动态性强、无序性大等特点给用户快速准确获取领域相关知识带来了困难.针对这一难题,提出一种基于特征词的领域知识起源抽取方法,以句子谓词为起源特征词,利用依赖动词特征词的关系抽取算法作为领域知识起源抽取方法.实验表明,该方法具有良好的准确率和召回率,能快速有效地从数据中挖掘出含有领域知识的起源,为后面构建领域知识间的知识图谱奠定基础.  相似文献   

8.
化学品危险评估与人民生命财产安全密切相关,化学品信息的运用直接影响危险评估的快捷程度和准确度。建立化学品危险评估知识图谱能有限管理和应用化学品信息。本文对化学品危险评估领域知识进行了梳理,在确定了领域范围、知识内容和基本本体层次关系基础上,提出了一种准确高效的领域知识构建方法—"NLP及人工智能辅助法":首先,利用爬虫技术对数据进行采集和清洗通过数据抓取及数据清洗;从获得7.8亿条结构化数据中利用中文分词、语义分析等技术进行了知识抽取,构建化学品危险评估知识主体层次关系;通过关系映射、语义分析等技术手段抽取本体属性;基于自然语言处理和人工智能技术苟安知识本体及知识图谱。本研究在一定程度解决了化学品评估知识图谱专业性强、数据量大、过程复杂;中文知识图谱构建的开放链接相对缺乏,导致目前国内尚没有成熟的化学品评估中文知识图谱的问题。化学品危险分类信息匹配为场景实现了初步应用,结果表明,化学品危险评估知识图谱在危险分类信息数据查询、匹配验证的应用将人工平均时间从4460秒压缩到137秒,准确率从86.2%提升到94.3%,大幅提高了化学品危险评估数据查询和匹配的效率。本文的工作进一步表明利用知识图谱可以更好的实现行业或专业领域知识的管理,具有重要应用价值。  相似文献   

9.
为解决碳交易领域数据集成问题,提出一种碳交易领域知识图谱的构建方法。针对碳交易领域的半结构化和非结构化数据,分别采用自定义的Web数据包装器和结合BiLSTM-CRF模型与依存句法分析的方法进行三元组抽取。然后将获取的知识转化为关联数据,得到完整的碳交易领域知识图谱,再利用基于Jena的fuseki实现对知识图谱的语义查询。实验结果表明,该方法能够为碳交易领域快速有效地构建知识图谱,并可以从碳交易领域的海量数据中检索出有用信息。  相似文献   

10.
基于属性图模型的领域知识图谱构建方法   总被引:1,自引:0,他引:1  
随着大数据时代的到来,各个行业领域需要处理的数据之间的关系数量呈几何级数增长,亟需一种支持海量复杂数据关系表示能力的数据模型,即领域知识图谱.虽然领域知识图谱展现了巨大的潜力,但不难发现目前仍然缺乏成熟的构建技术和平台.如何快速构建出领域知识图谱是一个重要挑战.在对领域知识图谱进行系统的研究后,提出了一种基于属性图模型...  相似文献   

11.
从文本信息中抽取关系三元组是构建知识图谱的关键任务,近年来受到工业界和学术界的广泛关注。针对旅游领域信息抽取过程中出现的实体嵌套和关系重叠问题,提出了一种基于双仿射注意力机制的实体关系联合抽取模型BAMRel,该模型通过共享编码层参数利用双仿射注意力机制在实体识别部分和关系抽取部分构建分类矩阵,并在关系抽取部分融合实体类型信息,提升关系抽取效果的同时增加了两个任务之间的交互。此外,通过远程监督和人工校验构建了旅游领域关系抽取数据集TFRED,BAMRel模型在此数据集上F1值达到了91.8%,有效地解决了实体嵌套和关系重叠问题。为了验证模型的鲁棒性,在百度DuIE数据集上与主流联合抽取模型进行了对比实验,BAMRel模型取得了最高的F1值80.2%。  相似文献   

12.
张宁豫  谢辛  陈想  邓淑敏  叶宏彬  陈华钧 《软件学报》2022,33(10):3531-3545
知识图谱补全能让知识图谱变得更加完整.现有的知识图谱补全工作大多会假设知识图谱中的实体或关系有充足的三元组实例.然而,在通用领域,存在大量长尾三元组;在垂直领域,较难获得大量高质量的标注数据.本文针对这一问题,提出了一种基于知识协同微调的低资源知识图谱补全方法.本文通过已有的结构化知识来构造初始的知识图谱补全提示,并提出一种协同微调算法来学习最优的模板、标签和模型的参数.本文的方法同时利用了知识图谱中的显式结构化知识和语言模型中的隐式事实知识,且可以同时应用于链接预测和关系抽取两种任务.实验表明,本文的方法在3个知识图谱推理数据集和5个关系抽取数据集上都取得了目前最优的性能.  相似文献   

13.
领域知识图谱在各行各业中都发挥着重要作用,领域实体的获取则是构建领域知识图谱的重要基础。数据标注、编写抽取规则等现有的实体抽取方法往往需要较多的人工参与工作。提出一种基于图排序的实体抽取方法和基于最大信息增益的实体扩展方法来构建领域实体集,通过实体识别获得候选实体,基于维基百科的背景信息计算候选实体间的相关度构建实体图,并利用基于置信度传播的图排序算法筛选领域核心实体。在DBpedia中根据最大信息增益来平衡类与领域核心实体相关性及类的抽象程度两个因素以生成实体扩展的共性类。在此基础上,通过SKOS体系中的“Is subject of”关系获得共性类的实例实体,并根据基于字符串相似和结构相关度的方法对扩展实例实体进一步筛选,最终获得全面、准确的领域实体集。以数据结构课程为例构建该课程领域实体集,得到1 115个实体。实验结果表明,在领域数据集上,领域实体抽取F1值达到0.67,能够在较少人工参与的条件下有效获得领域实体,有助于领域知识图谱的构建。  相似文献   

14.
关系数据库是行业中广泛使用的数据存储和管理方案,根据自定义的本体模型从关系型数据中进行知识抽取并转换成RDF是构建行业知识图谱的关键步骤。但是当前关系数据的知识抽取方案,需要进行大量的查询语句和映射的编辑工作,映射语句编码的工作量和映射的维护是关系型数据的知识抽取的主要障碍。针对以上问题提出一种能够自动解析关系数据和本体模型并生成对应关系,支持可视化调整和修正的关系型知识抽取转换框架。该框架简化了映射编辑和维护工作,提供了更自动化和简单易用的关系型数据的知识抽取的解决方案。最后应用该框架进行知识图谱的构建的实验表明,该框架能够较为高效地对关系数据进行知识抽取并转换成RDF。  相似文献   

15.
属性抽取是构建知识图谱的关键一环,其目的是从非结构化文本中抽取出与实体相关的属性值.该文将属性抽取转化成序列标注问题,使用远程监督方法对电商相关的多种来源文本进行自动标注,缓解商品属性抽取缺少标注数据的问题.为了对系统性能进行精准评价,构建了人工标注测试集,最终获得面向电商的多领域商品属性抽取标注数据集.基于新构建的数...  相似文献   

16.
知识图谱技术在行业领域的运用越来越广,因此研究知识图谱技术在成果地质资料领域中的运用,解决到馆用户的精确查询和可视化问题变得更加重要.本文以成果地质资料为研究对象,利用爬虫技术,爬取成果地质资料中的矿产、地理区域、组织机构等实体信息.结合知识图谱相关技术,设计成果地质资料知识图谱地质实体和关系,经过命名实体识别、关系抽取和属性抽取,构建成果地质资料实体266 787个,关系306 686个.使用Neo4j图形化数据库存储知识图谱来提高地质资料的查询性能,方便到馆用户的查询.该研究可以为知识图谱在成果地质资料上面的应用提供理论支撑.  相似文献   

17.
通过构造航空安全事件知识图谱并对其进行推理预测,可以有效预防航空安全事件的发生。目前,对于知识图谱的表示学习大多采用转移模型TransE,虽然其具有简单、高效的优势,但是在处理复杂关系时存在局限性。航空安全事件知识图谱不同于其他领域知识图谱,其中每个事件相互独立且又联系紧密,存在大量复杂关系,TransE模型不能很好地对其进行表示学习。为此,通过对航空安全事件语料库进行抽取来构建ASIKG数据集,利用公开数据集和ASIKG数据集对TransE的改进模型进行训练,实验结果表明,TransR模型在公共数据集上链接预测效果较好,而TransH模型在ASIKG数据集上取得了较好的链接预测效果。  相似文献   

18.
目前航空装备制造企业的设计、制造相关流程中积累了大量数据,基于知识图谱技术可以对这些数据进行有效融合与管理,对不断更新的制造知识进行挖掘,将为航空制造企业智慧化升级提供有力的知识支撑。为探明知识图谱在航空制造领域的理论支撑体系与实际应用情况,通过文献调研分析航空制造知识图谱架构、定义及特点;阐明知识图谱领域构建过程中的核心技术并进行研究综述,对比航空制造知识图谱与通用知识图谱构建技术上的异同,并提出了三个切合实际的航空制造知识图谱应用方向及其解决方案;最后对未来航空制造知识图谱的挑战进行了分析及展望,为后续该领域的研究提供一些思路。  相似文献   

19.
在知识互联的大数据环境下,初步构建的领域知识图谱可展示该领域知识的结构化信息,但实体之间隐含的潜在关系并未在图谱中得到充分表达。为解决领域知识图谱实体关系丰富和扩展问题,提出一种基于实体间关联规则分析与主题分析的关系发现方法。应用与领域实体相关的数据,通过实体间关联规则分析与实体相关数据集间主题分布相似度分析获取领域实体间潜在关系,将新发现的关系融合到初步构建的知识图谱中,实现领域知识图谱的潜在关系扩展。实验结果表明,该方法能够发现部门实体间的共性,挖掘出隐藏在领域实体间的关系,可有效地应用于领域实体间关系发现,丰富领域知识图谱。  相似文献   

20.
刘雅璇  钟勇 《计算机应用》2021,41(9):2517-2522
实体关系抽取是构建大规模知识图谱及各种信息抽取任务的关键步骤。基于预训练语言模型,提出基于头实体注意力的实体关系联合抽取方法。该方法采用卷积神经网络(CNN)提取头实体关键信息,并采用注意力机制捕获头实体与尾实体之间的依赖关系,构建了基于头实体注意力的联合抽取模型(JSA)。在公共数据集纽约时报语料库(NYT)和采用远程监督方法构建的人工智能领域数据集上进行实验,所提模型的F1值相较于级联二元标记框架(CasRel)分别获得了1.8和8.9个百分点的提升。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号