期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

袁健章海波《小型微型计算机系统》2022,(4):741-746

中文由于词边界模糊,字符信息获取不足等问题,使得中文实体识别较为困难.论文针对汉字的象形文字特点,提出一种结合字形特征的增强字符信息算法,该算法利用卷积神经网络和BERT模型得到增强字符向量;同时提出多粒度融合嵌入算法,利用注意力机制将增强字符向量与词向量融合,最终构建出多粒度融合嵌入的中文实体识别模型.实验表明,该模... 相似文献

2.

基于多级别特征感知网络的中文命名实体识别

宋威周俊昊《中文信息学报》2022,36(9):84-92

当前中文命名实体识别方法仅采用字级别或词级别特征方法进行识别,不能兼顾字和词级别的优点,难以获取足够的字形或者词义信息。针对此问题,该文提出一种基于多级别特征感知网络的中文命名实体识别方法。首先提出一种双通道门控卷积神经网络,通过感知字级别特征,在减少了未登录词的同时,也表示了字的字形信息。同时,为了获取词语的词义信息,该文在词级别的特征中嵌入对应位置信息。为了赋予实体更多的权重,该文利用自注意力机制感知带有位置信息的词级别特征。进一步,将上述得到的字级别和词级别信息融合,全面表示句子的语义信息。由于采用字词结合的方法容易产生冗余信息,该文设计一种门控机制的Highway网络,来过滤冗余信息,减少冗余信息对命名实体识别的影响,再结合条件随机场学习到句子中的约束条件实现中文命名实体的识别。实验结果表明,该文所提出的方法总体上优于目前主流的中文命名实体识别方法。相似文献

3.

融合注意力机制的电子病历命名实体识别

刘小云方玉华陈琛《计算机技术与发展》2020,(10):216-220

命名实体识别是自然语言处理中的一项基础性关键任务,基于电子病历命名实体识别是临床决策支持和医疗知识图谱构建等任务的基础.针对传统的双向长短时记忆神经网络(bi-directional long short-term memory,BiLSTM)结合条件随机场(conditional random field,CRF)的... 相似文献

4.

多头注意力与字词融合的中文命名实体识别

下载免费PDF全文

赵丹丹黄德根孟佳娜谷丰张攀《计算机工程与应用》2022,58(7):142-149

命名实体识别(named entity recognition,NER)是自然语言处理中重要的基础任务,而中文命名实体识别(Chinese named entity recognition,CNER)因分词歧义和一词多义等问题使其尤显困难.针对这些问题,提出多头注意力机制(multi-heads attention m... 相似文献

5.

基于多窗口注意力机制的中文命名实体识别

占文韬;吴晓鸰;凌捷《小型微型计算机系统》2024,(6):1325-1330

近年来,由于Transformer模型中应用的多头注意力机制能够有效地捕获较长的上下文信息,基于Transformer的模型已经成为主流方法．尽管这些模型能够有效捕获全局上下文信息,它们在局部特征和位置信息提取方面仍然有限．因此,本文提出了一种基于多窗口注意力机制的中文命名实体识别模型．首先,通过基于Transformer的预训练语言模型RoBERTa把文本表征为字符级嵌入向量,捕捉深度上下文信息,得到全局上下文信息;其次,局部特征提取模块利用多窗口循环机制,在全局特征提取模块的引导下提取局部特征和位置信息;最后,所提出的多窗口注意力机制有效地融合全局特征和多个局部特征来预测实体标签．在CMeEE和MSRA数据集上进行了实验验证;结果表明,本文所提出的模型分别获得了64.31%和94.14%的F1值,性能优于其他同类模型,验证了其在中文命名实体识别的有效性．相似文献

6.

融合多特征及协同注意力的医学命名实体识别

刘歆宁《计算机工程与应用》2024,60(6):188-198

针对当前中文医疗命名实体识别中未融合医学领域文本独有的特征信息导致实体识别准确率无法有效提升的情况,及单注意力机制影响实体分类效果的问题,提出一种基于多特征融合和协同注意力机制的中文医疗命名实体识别方法。利用预训练模型得到原始医学文本的向量表示,再利用双向门控循环神经网络（BiGRU）获取字粒度的特征向量。结合医疗领域命名实体鲜明的部首特征,利用迭代膨胀卷积神经网络（IDCNN）提取部首级别的特征向量。使用协同注意力网络（co-attention network）整合特征向量,生成<文字-部首>对的双相关特征,再利用条件随机场（CRF）输出实体识别结果。实验结果表明,在CCKS数据集上,相较于其他的实体识别模型能取得更高的准确率、召回率和F1值,同时虽然增加了识别模型的复杂程度,但性能并没有明显的降低。相似文献

7.

基于多注意力的中文命名实体识别

《信息与电脑》2019,(9)

笔者在基于神经网络的命名实体识别基础上,提出了改进的中文命名实体识别方法,通过调整网络中间的部分架构,引入Transformer编码模型,在没有添加文本外部信息的情况下,研究学习文本语句自身含义的方法,通过多注意力的学习增强文本的特征表示,捕捉更多字符间的关系,同时解决了长短期记忆网络不能并行计算的问题,并在企业舆情数据集上进行了实验和测试。与传统方法进行对比,验证了该方法可有效提高中文命名实体识别的准确率。相似文献

8.

基于注意力机制特征融合的中文命名实体识别

廖列法谢树松《计算机工程》2023,(4):256-262

命名实体识别是自然语言处理领域中信息抽取、信息检索、知识图谱等任务的基础。在命名实体识别任务中,Transformer编码器更加关注全局语义,对位置和方向信息不敏感,而双向长短期记忆（BiLSTM）网络可以提取文本中的方向信息,但缺少全局语义信息。为同时获得全局语义信息和方向信息,提出使用注意力机制动态融合Transformer编码器和BiLSTM的模型。使用相对位置编码和修改注意力计算公式对Transformer编码器进行改进,利用改进的Transformer编码器提取全局语义信息,并采用BiLSTM捕获方向信息。结合注意力机制动态调整权重,深度融合全局语义信息和方向信息以获得更丰富的上下文特征。使用条件随机场进行解码,实现实体标注序列预测。此外,针对Word2Vec等传统词向量方法无法表示词的多义性问题,使用RoBERTa-wwm预训练模型作为模型的嵌入层提供字符级嵌入,获得更多的上下文语义信息和词汇信息,增强实体识别效果。实验结果表明,该方法在中文命名实体识别数据集Resume和Weibo上F1值分别达到96.68%和71.29%,相比ID-CNN、BiLSTM、CAN-NER等... 相似文献

9.

基于特征融合与注意力机制的ＣＮＮ抑郁症识别

尚照岩乔晓艳《传感技术学报》2024,37(4):658-664

快速准确识别、筛查和预警轻度抑郁症具有重要现实意义,利用脑电数据和深度学习算法可以对精神心理疾病进行机器识别。提出一种基于特征融合的卷积神经网络(ＣＮＮ)模型,实现抑郁症的有效识别。将注意力机制引入ＣＮＮ模型,提取高效的时空特征图,增强特征的多样性,降低个体差异性的影响。结果表明:采用脑电ｇａｍｍａ节律,模型对抑郁症平均识别准确率达到(９９.３９±０.１４)％。此外,通过对卷积层特征图的可视化分析,获得了抑郁症和正常被试脑电差异性电极,并进行少电极抑郁症分类,识别准确率达到(９１.４１±１.１１)％。由此可见,该深度学习模型能够对轻度抑郁症进行有效识别和筛查。相似文献

10.

融合空洞卷积神经网络与层次注意力机制的中文命名实体识别

卢先领陈茹《中文信息学报》2020,(8):70-77

该文针对现有的命名实体识别(named entity recognition,NER)模型未考虑到文本层次化结构对实体识别的重要作用,以及循环神经网络受其递归性的限制导致计算效率低下等问题,构建了IDC-HSAN模型(Iterated Di-lated Convolutions Neural Networks and ... 相似文献

11.

基于双通道卷积神经网络的交通标志识别算法

孔月瑶严群姚剑敏林志贤《传感器与微系统》2021,(7):138-141

针对交通标志图像易受复杂背景、光照、运动模糊等影响导致识别率低和识别速度慢的问题,提出了基于非对称双通道卷积神经网络的交通标志识别方法.通过不同网络结构的两通路提取丰富的特征信息,上层通路使用跃层连接提取的浅层局部特征和深层全局特征,与下层通路提取的精细特征在全连接层进行融合,并使用激活函数LReLUs代替脆弱的ReL... 相似文献

12.

基于交互式特征融合的嵌套命名实体识别

廖涛黄荣梅张顺香段松松《计算机工程》2022,48(12):119-126+133

现有命名实体识别模型在字嵌入过程中多采用字符向量、字向量等不同单词表示向量的拼接或累加方式提取信息,未考虑不同单词表示特征之间的相互依赖关系,导致单词内部特征信息获取不足。提出一种基于交互式特征融合的嵌套命名实体识别模型,通过交互的方式构建不同特征之间的通信桥梁,以捕获多特征之间的依赖关系。采用交互机制得到包含不同单词表示信息的字嵌入向量,基于双向长短时记忆网络提取单词的表示特征,并对不同单词的表示特征进行交互,捕获特征之间的相互依赖关系。为进一步提取序列特征的上下文信息,采用基于特征交互的多头注意力机制捕获句子上下文的依赖关系。在此基础上,采用二元序列标记法过滤非实体区域,得到粗粒度候选区间,并对其进行细粒度划分以判断实体类别。实验结果表明,该模型的召回率和F1值为72.4%和71.2%,相比现有的嵌套命名实体识别模型,F1值平均提高了1.72%。相似文献

13.

基于多层动态融合的中文医疗命名实体识别

下载免费PDF全文

林令德刘纳徐贞顺李昂李晨《计算机工程与应用》2024,60(15):161-169

针对基于预训练模型的命名实体识别方法仅使用了预训练模型最后一层隐状态,忽略了各Transformer层对应不同文本信息的问题,提出一种预训练模型多层动态融合方法。采用预训练模型进行特征提取,获得模型各层隐状态序列;通过多层动态融合方法对各层隐状态信息进行结合,作为预训练模型最终输出;采用条件随机场对序列进行解码,完成序列标注。多层动态融合方法可以充分利用预训练模型各层知识,使结果中包含丰富的句法、语义等特征信息,提升模型在任务中的表示能力,增强模型灵活性。通过对医疗文本数据集CMeEE、CCKS2017与通用领域数据集Resume、Weibo进行实验验证,结果证明,加入多层动态融合方法可以有效地提升命名实体识别效果。相似文献

14.

融合空洞卷积神经网络与层次注意力机制的中文命名实体识别

陈茹卢先领《中文信息学报》1986,34(8):70-77

该文针对现有的命名实体识别(named entity recognition,NER)模型未考虑到文本层次化结构对实体识别的重要作用,以及循环神经网络受其递归性的限制导致计算效率低下等问题,构建了IDC-HSAN模型(Iterated Dilated Convolutions Neural Networks and Hierarchical Self-attention Network)。该模型通过迭代的空洞卷积神经网络(ID-CNN)充分利用GPU的并行性大大降低了使用长短时记忆网络的时间代价。然后,采用层次化注意力机制捕获重要的局部特征和全局上下文中的重要语义信息。此外,为了丰富嵌入信息,加入了偏旁部首信息。最后,在不同领域数据集上的实验结果表明,IDC-HSAN模型能够从文本中获取有用的实体信息,和传统的深度网络模型、结合注意力机制的命名实体识别模型相比识别效果有所提升。相似文献

15.

基于多重注意力机制的中文医疗实体识别

陈明刘蓉张晔《计算机工程》2023,49(6):314-320

医疗实体识别是从医疗文本中识别疾病、症状、药物等多种类型的医疗实体,能够为知识图谱、智慧医疗等下游任务的发展提供支持。针对现有命名实体识别模型提取语义特征较单一、对医疗文本语义理解能力不足的问题,提出一种基于多重注意力机制的神经网络模型MANM。为捕获文本中更丰富的语义特征,在模型输入中引入医疗词汇先验知识,通过自注意力机制获取医疗文本的全局语义特征,并利用双线性注意力机制获取词汇和字符层面的潜在语义特征,得到包含字词间依赖关系的特征向量。为提高模型的上下文信息捕捉能力,采用改进的长短时记忆网络提取文本时序特征,同时设计多头自注意力机制获取词语间隐含的关联语义特征。最后融合上述多层次语义特征,利用条件随机场进行实体识别。在公开数据集CMeEE、CCKS2019、CCKS2020上进行对比实验,实验结果表明,MANM模型在3个数据集上的F1值分别达到64.29%、86.12%、90.32%,验证了所提方法在医疗实体识别中的有效性。相似文献

16.

基于深度学习多模型融合的医疗命名实体识别

《计算机应用与软件》2022,39(10)

相似文献

17.

基于深度学习的医疗命名实体识别

下载免费PDF全文

贾杨春朱定局《计算机系统应用》2022,31(9):70-81

医疗命名实体识别指从海量的非结构化的医疗数据中提取关键信息,为医学研究的发展和智慧医疗系统的普及提供了基础.深度学习运用深层非线性的神经网络结构能够学习到复杂、抽象的特征,可实现对数据更本质的表征.医疗命名实体识别采用深度学习模型可明显提升效果.首先,本文综述了医疗命名实体识别特有的难点以及传统的识别方法;其次,总结了基于深度学习方法的模型并介绍了较为流行的模型改进方法,包括针对特征向量的改进,针对数据匮乏、复杂命名实体识别等问题的改进;最后,通过综合论述对未来的研究方向进行展望. 相似文献

18.

一种基于部件CNN的网络安全命名实体识别方法

魏笑秦永彬陈艳平《计算机与数字工程》2020,48(1):106-111

基于知识图谱的网络安全动态预警方法,能够主动感知和应对网络安全攻击,增强感知的实时性和精准性。然而,在构建网络安全知识图谱的实体抽取过程中,传统的命名实体识别工具和方法无法识别网络安全领域中的特定类别实体,文本中的未登录和中英文混合的网络安全实体也难以被准确识别。网络安全文本中的网络安全命名实体存在中英文混合、单词缩写等问题,仅基于字的命名实体识别方法难以充分表征字或词的语义信息。因此,论文考虑中英文更细粒度的部件语义捕捉字或词的语义特征,提出一种基于部件CNN的网络安全命名实体识别方法(C C-NS-NER),利用部件CNN抽取词语部件特征中的关键语义特征,丰富字词级别的语义信息,并引入BiLSTM-CRF确保抽取字向量和部件特征中的抽象信息,同时获取标签之间的关联信息,识别文本中的网络安全命名实体。在人工标注的网络安全数据集上的实验结果表明,该方法相较于传统模型,能有效获取字或词的部件语义信息,显著提高网络安全命名实体识别的效果。相似文献

19.

多粒度融合的命名实体识别

孙红王哲《中文信息学报》2023,(3):123-134

目前主流的命名实体识别算法都是从词汇增强的角度出发,引入外部词汇信息提升NER模型获取词边界信息的能力,并未考虑到中文字结构信息在此任务中的重要作用。因此,该文提出多粒度融合的命名实体识别算法,同时引入中文字结构与外部词汇信息,通过编码汉字中每个字部件,并使用注意力机制使得文本序列中的字启发式地融合细粒度信息,赋予模型获取中文字形特征的能力。在多个命名实体识别数据集上的实验结果显示,该算法在模型精度以及推理速度方面具有较大优势。相似文献

20.

面向配电网数据的命名实体识别

下载免费PDF全文

孙宏云李喜旺《计算机系统应用》2023,32(2):387-393

在电力系统中, 配电调度是一个复杂且统筹性较强的工作, 大多依赖于工作人员的经验和主观判断, 极易出现纰漏. 所以急需利用智能化手段来帮助检修计划的分析与生成. 命名实体识别是构建配电网知识图谱以及问答系统等任务的关键技术, 它能够将非结构化数据中的命名实体识别出来. 针对配电检修数据的复杂性及强关联性等特点, 本文采用BERT-IDCNN-BiLSTM-CRF深度学习模型. 该模型相较于传统的BERT-BiLSTM-CRF模型, 融入IDCNN神经网络模型, 更好地利用GPU的性能, 在保证识别准确率的前提下, 提高效率. 通过对标注好的检修计划数据进行训练, 并与其他常用模型对比, 在召回率、精确率以及F1值3个指标上, 本文提出的模型均达到最优的效果, F1值可以达到83.1%, 该模型在配电网数据识别任务上取得了很好的效果. 相似文献