首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
为加强实体识别任务与关系识别任务之间的联系,获取实体关系隐含的结构特征,提出一种基于语义图嵌入的实体与关系联合识别方法。根据识别得到的实体关系三元组构建语义图,采用图神经网络对语义图进行编码,捕获文本中隐含的实体关系结构特征,从而获取更丰富的语义信息,提高识别效果。在Lc-QUAD2.0,CWQ以及KQA pro数据集上进行测试,结果表明,提出方法提高了实体识别和关系识别效果,验证了该方法的有效性。  相似文献   

2.
为了避免问句理解阶段过度依赖命名实体,通过语义关系理解中文自然语言问句中关键信息的逻辑关系,提出基于依赖结构的语义关系识别方法,从问句的依赖结构集中识别出对生成语义关系有价值的三类依赖结构集,将三类依赖结构集组合或转换得到语义关系。在中文标准问答数据集上的试验结果验证了本语义关系识别方法的有效性和可扩展性,本方法在命名实体识别失败时也可以理解中文自然语言问句。  相似文献   

3.
遥感影像飞机目标识别是实现地面特定目标的精准打击、掌握机场军事价值的重要途径.针对飞机识别数据集未充分参照不同条件下飞机几何形态的问题,构建了飞机类型识别数据集,同时为进一步提高识别精度,基于区域全卷积网络(R-FCN)识别框架,提出飞机目标全卷积神经网络(AFFCN)识别方法.通过人工增强方法,扩增包含四种类型飞机影像的数量,构建了每种类型飞机识别数据集;基于深度残差网络能有效区分不同类型目标的性质,提出了飞机目标深度残差网络,并将此网络应用于R-FCN识别框架中,建立了AFFCN识别方法.仿真结果表明,该方法结合本文数据集可以准确地识别遥感影像中的飞机目标.  相似文献   

4.
基于医疗类别的电子病历命名实体识别研究   总被引:2,自引:2,他引:0  
基于电子病历命名实体识别对智慧医疗和医疗知识图谱的构建具有重要意义,提出一种基于医疗类别的命名实体识别方法。首先,针对电子病历语料中实体特点进行深度挖掘,将电子病历分为4类医疗类别;然后,对各医疗类别分别构建特征集,并使用条件随机场模型对身体部位、症状和体征、检查与检验、疾病与诊断、治疗等5类命名实体进行命名实体识别;最后,将基于医疗类别特征集识别效果和通用特征集的识别结果进行对比。实验结果表明,基于医疗类别的电子病历命名实体识别效果显著提升,可以满足应用需求。  相似文献   

5.
提出了一种基于Transformer编码器和BiLSTM的字级别中文命名实体识别方法,将字向量与位置编码向量拼接成联合向量作为字表示层,避免了字向量信息的损失和位置信息的丢失;利用BiLSTM为联合向量融入方向性信息,引入Transformer编码器进一步抽取字间关系特征。实验结果表明,该方法在MSRA数据集和唐卡数据集上的F1值分别达到了81.39%和86.99%,有效提升了中文命名实体识别的效果。  相似文献   

6.
在信息技术和工业自动化迅速发展的时代,源源不断地产生着大批量的数据,这些数据中大量指代同一实体的重复数据,给数据分析和处理带来了很大的困难。在以往研究的基础上,提出了一种基于MapReduce的实体共指消解的方法,该方法通过引入权重和相似度的度量指标,利用Hadoop平台和MapReduce框架把数据处理成key-value数据实体对的形式,进而对数据进行共指消解处理。经过实验,表明了该方法能够提高实体共指消解的准确率和速度,满足了企业在当前形势下实体共指消解的需求。  相似文献   

7.
命名实体识别是自然语言处理的核心任务。在基于深度学习的中文命名实体识别方法中,静态字向量无法表征字的多义性。针对该问题,提出了基于XLnet嵌入的中文命名实体识别方法。该方法首先通过XLnet(Generalized Autoregressive Pretraining for Language Understanding,XLnet)模型获取字级别的上下文表示。其次,利用BiLSTM-CRF模型获取文本依赖信息和标签信息。实验结果表明,该方法在人民日报、MSRA、Boson等3种数据集上分别达到91.9%、89.8%、74%的F1值,均高于其他主流的中文命名实体识别方法。  相似文献   

8.
命名实体识别是自然语言处理中一项非常重要的任务, 一句话中可以正确理解其中的实体, 对于是否能正确理解这句话至关重要, 而中文的命名实体识别相比英文更有难度, 原因在于中文没有英文中类似空格的边界标示词, 且存在复杂的嵌套现象。针对现有的中文命名实体识别方法中大多只利用单一层次的特征这一问题, 利用Bert中文预训练集和额外的词汇数据集的融合模型增强词意和中文上下文联系, 采用BiGRU 网络获取序列特征矩阵,通过条件随机场模型生成全局最优序列, 从而提升实体识别准确率。实验结果表明该方法在公开数据集上的效果优于现有模型。  相似文献   

9.
通过研究Hadoop平台和MapReduce编程框架,提出了一个基于MapReduce的并行遮盖文本聚类算法.遮盖算法提出了两个距离阈值T1,T2用来构建重叠子集,避免了传统聚类算法对噪声敏感的缺点.同时采用适当的快速近似距离度量,大大加快了聚类速度.实验表明该算法在MapReduce框架下有良好的集群加速性能,适合处理大规模的数据集.  相似文献   

10.
提出了一种基于Transformer和隐马尔科夫模型的字级别中文命名实体识别方法。本文改进了Transformer模型的位置编码计算函数,使修改后的位置编码函数能表达字符之间的相对位置信息和方向性。使用Transformer模型编码后的字符序列计算转移矩阵和发射矩阵,建立隐马尔科夫模型生成一组命名实体软标签。将隐马尔科夫模型生成的软标签带入到Bert-NER模型中,使用散度损失函数更新Bert-NER模型参数,输出最终的命名实体强标签,从而找出命名实体。经过对比实验,本文方法在中文CLUENER-2020数据集和Weibo数据集上,F1值达到75.11%和68%,提升了中文命名实体识别的效果。  相似文献   

11.
命名实体识别作为信息抽取的核心任务,能够从文本中识别出各类命名实体。近年来,深度学习技术在字词表示、特征提取等方面上的应用,使中文命名实体识别任务取得了较为丰富的研究成果。目前,基于深度学习的中文命名实体识别技术,在特征提取的深度和模型的精确度上已逐渐超过了传统的基于规则的方法、基于特征工程的有监督方法和基于无监督的方法。围绕深度学习的识别框架,将现有基于深度学习的中文命名实体识别方法分嵌入层、编码层和标签解码层三部分进行介绍,并对未来可能的研究方向进行探讨和展望。  相似文献   

12.
命名实体识别(Name Entity Recognition,NER)是文本信息抽取的关键步骤之一。近年来,结合词汇信息与字符信息的命名实体识别方法表现优异,引起了众多学者的广泛注意。然而目前的字词融合策略还存在可迁移性差、词汇信息遗失、难以明确词汇边界信息等问题。基于此,提出一种动态字词信息融合的中文命名实体识别方法,首先利用多头自注意力机制动态融合对应位置的词汇信息与字符信息形成词汇集合信息,其次动态融合词汇集合信息确定对应的词汇边界,利用词汇向量优化字符向量表示,最后利用BiLSTM-CRF完成序列解码识别命名实体。实验证明,在MSRA、ONTO、WEIBO等3个公开数据集上,中文命名实体识别方法较之字粒度的命名实体识别方法性能大幅提升,同时可与BERT等预训练模型有效结合,具有良好的可迁移性、可完整而动态的融合词汇信息与字符信息提升命名实体识别性能。  相似文献   

13.
针对传统物联网设备类型识别方法在数据特征不明显、训练数据不足的情况下,难以对设备进行准确识别的问题,提出一种基于卷积神经网络的物联网设备类型识别方法。首先从互联网上获取设备WEB接口的页面截图构造数据集,然后利用卷积神经网络的泛化能力提取截图的模糊特征,构建多标签识别模型,实现对设备类型的准确识别。与传统的基于WEB页面的设备类型识别方法相比,减少了对数据特征和规模的依赖。实验结果表明,该方法的准确率达到了78.8%,与成熟的图像识别架构Xception和ResNet50相比,更适合物联网设备类型识别。  相似文献   

14.
逻辑回归中的批量梯度下降算法需要访问全部数据样本,在单节点环境下计算耗时较长。针对大批量数据集的训练问题,提出了一种基于MapReduce框架的并行化算法。首先利用HDFS文件系统存储训练数据集,MapReduce框架会对输入数据集进行分片处理,每一个分片交由一个Map节点进行处理;Map过程的输出结果会传给Combiner节点,进行各个分片内部的数据归并;所有分片的归并结果会通过Shuffle过程,进行各个分片间的数据合并,汇总成一个输出文件;输出文件会传给Reduce节点进行运算,最后将计算结果用于参数更新。实验结果表明,集群环境下的参数训练结果正确,随着数据集的扩大,并行化计算的优势逐渐显现。  相似文献   

15.
为了解决多模态命名实体识别(MNER)研究中存在的文本特征语义不足、视觉特征语义缺失、图文特征融合困难等问题,多模态命名实体识别方法相继被提出。首先,总结了多模态命名实体识别方法的整体框架以及各部分常用的技术,随后对其进行梳理并分类为基于BiLSTM的MNER方法和基于Transformer的MNER方法,并根据模型结构将其划分为前融合模型、后融合模型、Transformer单任务模型、Transformer多任务模型等4类模型结构。其次,在Twitter-2015、Twitter-2017 2个数据集上,分别对这2类方法进行实验,结果表明:多特征协同表示能增强各模态特征的语义,多任务学习能够促进模态特征融合或者结果融合,从而提升MNER的准确性。建议在MNER的未来研究中,着重关注通过多特征协同表示来增强模态语义,通过多任务学习促进模态特征融合或结果融合等方向的研究。  相似文献   

16.
针对识别学习中的多维信息融合问题, 提出一种基于多元函数主成分表示识别方法。给出多元函数主成分的数值计算方法, 利用联合协方差算子计算特征值与特征向量, 提取关键区分特征。基于这些综合特征应用随机森林方法对多元函数型数据进行识别学习。在模拟数据和真实数据上比较多元函数主成分表示方法与其他几种表示方法的识别性能。试验结果表明, 在模拟数据集、英文手写体数据集和中文手写体数据集中, 准确率为1, 在运动数据集中, 准确率为0.954 4。相较于其他方法, 多元函数主成分分析这一特征抽取方法的识别效果更好, 有效地提高了识别准确率。  相似文献   

17.
该文提出一种基于随机森林的不完整数据集的多功能雷达(MFR)辐射源识别方法,该方法在MFR辐射源波形单元识别框架基础上,首先对参数缺失的先验知识集进行多重划分,得到多个不含缺失参数的样本子集,然后删减冗余子集并利用随机森林算法对各个子集构建弱分类器,最后根据弱分类器对识别结果贡献率的不同,进行权值设定,得到最终的识别模型。仿真实验证实了提出的MDRF-WA方法能够提高少量先验知识条件下波形单元识别的准确率和鲁棒性,降低计算成本。  相似文献   

18.
目的 为有效利用监测系统大量冗余、互补数据,对结构的工作状态展开评估.方法 运用粗集进行属性约简达到海量数据的降维工作,进而提取有效的特征参数,运用概率神经网络(PNN)良好的处理噪声等不确定信息及概率推理能力,进行推理计算和损伤识别.结果 对某12层钢筋混凝土框架不同噪声水平下的三种损伤模式进行了识别,识别精度均在85%以上,并与PNN损伤识别方法进行了比较,其识别精度高于PNN.结论 提出了一种基于粗集与PNN的结构损伤识别新方法,该方法不仅可以降低数据的空间维数.减少冗余属性和不确定性,而且可以提高损伤识别精度.  相似文献   

19.
针对变电站多种电气设备实时检测的需求,提出了一种基于改进YOLOv5s的电气设备识别方法,并设计基于Android部署的电气设备识别APP,以便对电气设备进行识别与学习。以电力变压器、绝缘子串等6种常见变电站电气设备为例构建图像数据集。数据集进行图像预处理后对YOLOv5s算法进行改进。通过引入C2f模块提高小目标检测精度,采用Soft-NMS提高检测框筛选能力,减少漏检和误检的情况,使用改进后的算法对数据集进行模型训练。将训练好的识别网络模型通过TensorFlow Lite框架进行模型部署,设计电气设备识别APP。经验证,改进后的变电站电气设备识别网络模型mAP稳定在91.6%,与原模型相比提高了3.3百分点。部署后的APP具有设备识别和设备介绍等界面,使用移动端进行识别时每张图片识别时间都小于1 s,具有较快的识别速度和较高的识别精度,可以高效地实现变电站电气设备的实时检测与设备学习。  相似文献   

20.
医疗病历命名实体识别的主要任务是将临床电子病历中的非结构化文本转化为结构化数据,进而为面向医疗领域任务开展的数据挖掘提供基础支撑. 提出一种基于ALBERT模型融合学习的中文医疗病历命名实体识别模型. 首先,采用人工标注方式扩展样本数据集,结合ALBERT模型对数据集进行微调; 其次,采用双向长短记忆网络(BiLSTM)提取文本的全局特征; 最后,基于条件随机场模型(CRF)命名实体的序列标记. 在标准数据集上的实验结果表明,该方法进一步提高了医疗文本命名识别精度,减少了时间开销.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号