首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
实体识别技术作为知识图谱构建的重要步骤,已广泛用于语义网络、机器翻译、问答系统等自然语言处理中,在推动自然语言处理技术落地实践的过程中起着非常关键的作用。本文根据实体识别技术的发展历程调研了现有的实体识别方法,主要为早期基于规则和词典的实体识别方法、基于机器学习的以及基于深度学习的命名实体识别方法;整理了每种实体识别方法的关键思路、优缺点和具有代表性的模型,特别对目前使用较多的基于双向长短期记忆网络(BiLSTM)模型和基于Transformer模型的实体识别方法进行了概述;介绍了目前主流的数据集以及评价标准。最后,面向未来机器类通信的语义需求,总结了实体识别技术面临的挑战,并对其未来在物联网业务数据方面的发展进行了展望。  相似文献   

2.
马璐  牛珂 《现代信息科技》2023,(23):156-161
知识图谱技术能够将海量大数据中的信息、数据以及关联关系汇聚为知识网络,实现用户智能化检索与意图分析推理。通过对知识图谱构建过程中本体构建,多源异构互联网数据的实体抽取、关系抽取、图谱更新与维护等关键技术进行研究,构建了军事目标专业领域知识图谱,并在可视化查询、智能问答、高价值关系推荐等方向进行了应用探索,有效提高了数据的使用效益,为军事情报分析和知识应用提供了一种有效的工具和方法。  相似文献   

3.
知识图谱作为辅助信息可以有效缓解传统推荐模型的冷启动问题。但在提取结构化信息时,现有模型都忽略了图谱中实体之间的邻居关系。针对这一问题,该文提出一种基于共同邻居排序采样的知识图谱卷积网络(KGCN-PN)推荐模型,该模型首先基于共同邻居数目对知识图谱中的每个实体邻域进行排序采样;其次利用图卷积神经网络沿着图谱中的关系路径将实体自身信息与接收域信息逐层融合;最后将用户特征向量与融合得到的实体特征向量送入预测函数中预测用户与实体项目交互的概率。实验结果表明该模型在数据稀疏场景下相较其他基线模型性能均获得了相应提升。  相似文献   

4.
通过自然语言处理技术,可以将海量情报信息中的实体进行结构化提取,并通过图计算的方式进行关联分析,从而为情报部门快速侦破案情提供线索帮助.文中论证研究了通过使用知识表示、基于长短时记忆神经网络的命名实体识别、图数据库等技术,针对情报数据进行信息提取、信息过滤、情报知识库建立,进行关联挖掘和分析.  相似文献   

5.
命名实体识别是自然语言处理领域的一项关键任务,其目的在于从自然语言文本中识别出具有特定含义的实体,如人名、地名、机构名和专有名词等。在命名实体识别任务中,研究人员提出过多种方法,包括基于知识和有监督的机器学习方法。近年来,随着互联网文本数据规模的快速扩大和深度学习技术的快速发展,深度学习模型已成为命名实体识别的研究热点,并在该领域取得显著进展。文中全面回顾现有的命名实体识别深度学习技术,主要分为四类:基于卷积神经网络模型、基于循环神经网络模型、基于Transformer模型和基于图神经网络模型的命名实体识别。此外,对深度学习的命名实体识别架构进行了介绍。最后,探讨命名实体识别所面临的挑战以及未来可能的研究方向,以期推动命名实体识别领域的进一步发展。  相似文献   

6.
缺陷数据分析正成为软件工程领域的热点,现有缺陷分析技术无法有效处理复杂和冗余的缺陷数据,以高效地辅助缺陷修复工作.本文提出一种多特征匹配搜索算法——MMSBK(Multi-feature Matching Search Algorithm for Bug Knowledge).首先对缺陷问题进行分析,抽取其包含的缺陷实体及关系;然后,基于实体和关系匹配将缺陷问题与缺陷知识图谱关联,通过知识图谱的关联性和可视化帮助软件开发搜索缺陷知识;最后,基于匹配算法生成的缺陷关系三元组生成搜索结果子图.实验验证了MMSBK算法的有效性.  相似文献   

7.
针对传统关联分析技术应用于网页文本分析上存在的问题,提出一种基于命名实体及实体关系的网页文本关联分析方法.该方法以命名实体和实体关系作为特征来代替传统高频词,首先采用基于向量相似度比较的修正策略来提取网页文本中的命名实体,然后分析Maxfpminer算法并对其进行改进,利用改进的Maxfpminer算法对网页文本进行关联分析.实验结果表明,该方法分析得到的知识模式的有效性和可读性均优于传统方法.  相似文献   

8.
为解决现有电磁大数据管理手段单一,无法充分利用电磁数据的弊端,引入分区管理的概念,采用聚类算法将电磁数据按地理属性进行分区,利用图数据库对电磁数据进行管理,将电磁聚类后的结果转化为知识图谱实体,抽取实体之间的关系,发掘电磁数据间的潜在关联。针对电磁干扰源定位难、效率低下的问题,提出了以知识图谱为基础,大数据实时处理技术为辅助的改进接收信号强度指示(RSSI)定位算法,并实验仿真了真实电磁数据下干扰源定位的过程,分析了单目标干扰源和多目标干扰源下定位的性能。实验结果表明,所提的基于知识图谱的电磁干扰源定位方法较传统RSSI定位方法效果更显著,误差更小。  相似文献   

9.
跨语言实体对齐旨在找到不同语言知识图谱中指向现实世界同一事物的实体.传统的跨语言实体对齐方法通常仅依靠知识图谱内部的结构信息,但实际上一些知识图谱提供的实体描述信息也可以被利用.本文提出了一种结合知识图谱的内部结构和实体描述信息共同进行跨语言实体对齐的模型.该模型首先通过训练基于知识图谱结构信息的知识向量找到可能被对齐的实体对,再结合实体描述信息利用改进后的共享参数模型选出最终的对齐实体,最后通过迭代对齐的方法重复前两个步骤找到更多的对齐实体直到训练结束.实验结果表明,与基准算法相比,本文所提模型在跨语言实体对齐任务上可以取得相对不错的结果.  相似文献   

10.
知识图谱拥有强大的表达能力,借助知识图谱可快速生成检索配电网设备选型、配置连接的辅助决策规则库,有利于降低配电网规范使用难度.同时,由于自动从技术规范文档提取实体关系时存在实体缺失和语义模糊等问题,文中提出基于GCN的配电网知识图谱构建方法,利用文档的语法依存关系和图神经网络的消息传递能力,实现多元实体关系抽取,以提高...  相似文献   

11.
在旅游领域,互联网的发展催生了海量的信息,可以应用知识图谱组织起来。但对于知识图谱里的知识,需要不断补充现实世界里的知识,以维护知识图谱的完整性。本文利用实体集合扩展的技术,从互联网数据中扩展实体集合,实现对知识图谱的扩展。  相似文献   

12.
针对当前基于知识图谱的推荐模型没有充分挖掘知识图谱语义结构信息的问题,提出一种融合知识图谱表示学习方法和信息协同传播机制的推荐模型KCOD。KCOD基于经典的知识图谱表示学习模型DistMult与TransR建模并推理实体三元组的语义关系,然后通过交叉计算每一阶历史交互实体向量推理结果与候选物品实体向量推理结果的相似度,进行模型训练及偏好预测。实验结果显示KCOD的性能优于经典对比模型。  相似文献   

13.
高留杰  赵文  张君福  姜波 《电子学报》2021,49(6):1132-1141
问题意图理解是知识图谱问答的主要任务之一,语义解析是当前理解问题意图的主流方法.其主要挑战是如何充分利用知识图谱上下文理解问句中的隐含实体或关系,以及时间、排序和聚合等复杂约束条件等意图.为了应对这些挑战,本文提出了一种基于语义块的知识图谱问答语义解析框架——Graph-to-Segment,框架中的语义解析模型结合了基于规则的准确度和基于深度学习的覆盖度,实现了问题到语义块序列的解析和语义查询图的构造.框架将问题意图使用基于语义块的语义查询图表示,将问题的语义解析建模为语义块序列生成任务,采用编码器-解码器神经网络模型实现问题到语义块序列的解析,然后通过语义块组装形成语义查询图.同时,结合知识图谱中的上下文信息,模型使用图神经网络学习问题的表示,改进隐含实体或关系的语义解析效果.在两个知识图谱问答数据集上的实验表明,模型性能达到了良好的效果.  相似文献   

14.
电力系统信息的准确检索对于指导电力系统的全生命周期管理具有重要作用。由于存在数据孤岛、答案搜索精度较低等问题,电力系统亟需采取新的策略来提高数据存储和提取效率。针对以上问题该文提出了一种面向多源异构数据情景下的电力系统,主要借助领域知识图谱构建技术以及相关知识问答方法,以智能辅助后续业务决策。首先合并现有多源异构电力系统相关数据,采用本体建模的方式对电力系统中的各项概念和公理进行约束定义。然后采用一种基于依存语义范式的无监督中文实体关系抽取模型对中文电力领域文本中的细粒度实体和关系进行三元组抽取以构建知识图谱,借助Neo4j图数据库辅助领域知识图谱的存储,并根据领域问题模板匹配的方式实现细粒度电力系统领域问答通过交互式问答原型系统验证文章所提方法的有效性。  相似文献   

15.
本文使用大规模预训练汉语模型的BERT-BiLSTM-CRF方法,从运营商的非结构化文本数据中联合提取命名实体与关系。首先,通过运营商非结构化文本数据建立运营商文本语料库,对语料进行文本标签标注;然后,提出一种基于运营商文本命名实体与关系提取的BERT-BiLSTM-CRF模型方法。实验结果表明,该技术在运营商文本命名实体与关系联合提取中适用性较强,在运营商文本的命名实体与关系联合提取中,F1值高达93.2%,可以将该方法应用到实际问题解决中。  相似文献   

16.
针对农业信息化在蜜蜂领域缺失的问题,提出了一定规模的蜜蜂领域知识图谱的构建。首先,通过爬虫程序获取到真实有效的数据集,再经过相似度计算进行知识融合。然后,利用图数据库Neo4j对知识进行存储,完成蜜蜂领域的知识图谱的构建。最后,通过命名实体识别和问句意图识别任务分解智能问答,并通过Flask框架搭建可视化的页面,最终实现了智能问答系统。实验结果表明,所设计的智能问答系统在蜜蜂知识问答领域,在一定程度上弥补该领域的空白,也为农业信息化落地提供了思路。  相似文献   

17.
在巨大的利益诱惑下,网络攻击技术正在快速畸形发展,与此同时网络防御技术却显得捉襟见肘,缺乏有效的技术手段和理论依据对网络威胁事件进行追踪溯源.针对攻击数据碎片化、溯源线索难提取、攻击链条难关联等问题,分析网络威胁情报的特点,设计网络安全知识图谱,包括6类网络威胁情报实体、14种实体关系,以构建的知识图谱为基础,提出5种...  相似文献   

18.
时序知识图谱推理是将时序信息引入知识表征学习和知识推理任务中,旨在推断事件在未来的演变趋势.针对大多数时序知识图谱推理方法存在跨时间实体与关系推理能力有限的问题,提出基于多关系事件和注意力机制的时序知识图谱推理模型(Attention Events Network,Attn-Net).为利用时序知识图谱中推理任务与时序事件的关联信息,往往需要设计专门的、复杂度高的时序编码器.然而循环神经网络作为最常用的一类序列编码器,忽略了序列节点与任务之间的关联程度,并不能很好适用于知识推理.文中提出了使用自注意力机制序列编码模型来融合序列的历史信息,计算推理任务与时序历史信息的注意力标量,从而得到更准确的历史事件关联信息编码.在此基础上,使用注意力机制优化多关系邻域聚合器,根据不同关系下事件关注程度计算得到实体的邻域表示,从而获得更准确的事件编码,最终获取了更准确的实体邻域向量表示.在WIKI和YAGO数据集上实验表明,Attn-Net的效果分别提升了1.5%和2%,且有效提高了时序知识图谱推理的能力.  相似文献   

19.
传统知识图谱链接预测任务忽略了知识之间可能存在的语义层次以及知识的不确定性,导致链接预测结果不佳。针对该问题,文中提出一种高斯层次感知知识图谱链接预测模型。在该模型中,高斯嵌入部分引入实体和关系的高斯分布信息,以实体分布和关系分布之间的距离来衡量实体之间是否存在链接。词向量嵌入部分将学习到的实体和关系的词向量转换为复向量,将词的复向量映射到极坐标系中建模实体的语义层次,以嵌入向量之间的距离来衡量实体之间是否存在链接。根据D-S证据理论,融合两部分得分函数,从而实现准确的知识图谱链接预测。实验结果表明,该模型可以有效地对知识图中实体的语义层次和不确定性进行建模,并且在现有基准数据集上的效果较优于其他方法。  相似文献   

20.
现有的大多数知识表示学习模型孤立地看待每个知识三元组,未能发现和利用实体周围邻域特征信息,并且将树状层级结构的知识图谱嵌入到欧式空间,会带来嵌入式向量高度失真的问题。为解决上述问题,该文提出了一种基于双曲图注意力网络的知识图谱链路预测方法(HyGAT-LP)。首先将知识图谱嵌入到负常数曲率的双曲空间中,从而更契合知识图谱的树状层级结构;然后在所给实体领域内基于实体和关系两种层面的注意力机制聚合邻域特征信息,将实体嵌入到低维的双曲空间;最后利用得分函数计算每个三元组的得分值,并以此作为判定该三元组成立的依据完成知识图谱上的链路预测任务。实验结果表明,与基准模型相比,所提方法可显著提高知识图谱链路预测性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号