首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
《Planning》2022,(2)
为了解决渔业标准文本中专有命名实体具有上下文敏感性、长序列存在语义稀释等问题,提出了基于E-BIO标注法和融合注意力机制的BiLSTM+CRF (BiLSTM+Attention+CRF)命名实体识别模型,E-BIO标注法引入渔业标准文本中的结构化信息,可以使模型有效学习上下文结构特征,而注意力机制输出不断变化的语义向量,可有效解决长序列语义稀释问题。为验证所提出方法的有效性,在采用E-BIO方法标注的语料上进行对比试验,结果显示,BiLSTM+Attention+CRF模型对不同类别的渔业标准命名实体识别的准确率均能达到90%以上,召回率均能达到85%以上。研究表明,本研究中提出的BiLSTM+Attention+CRF命名实体识别模型可以有效利用上下文结构特征,避免了语义稀释问题,对于渔业标准命名实体识别具有较好的识别性能。  相似文献   

2.
《Planning》2022,(4)
为解决渔业标准命名实体识别任务中部分实体语料分布稀疏导致的效果不佳问题,提出了基于多元组合数据增广(data augmentation method based on multiple combination, MCA)的渔业标准命名实体识别方法,该方法融合了基于领域词典的联合替换算法(joint replacement algorithm based on domain dictionary, DDR)、基于槽点保护的随机删除算法(random deletion algorithm based on slot protection, SPD)和基于槽点保护的随机插入算法(random insertion algorithm based on slot protection, SPI)进行语料库的数据增广,首先构建"水产品名称"同类词词典和领域同义词词典,通过两个词典分别对"水产品名称"类实体和随机词进行同类词替换和同义词替换,生成新的句子,以增加目标实体数量和句子的多样性,然后在基于槽点保护的情况下对原句子分别进行随机删除和随机插入操作,在保留实体及上下文特征的情况下进一步丰富语料的多样性,提高模型的泛化能力。结果表明,采用基于融合注意力机制的BERT+BiLSTM+CRF网络模型和多元组合数据增广方法进行渔业标准命名实体识别,准确率、召回率、F1值分别达到了91.73%、88.64%、90.16%,具有较好的效果。研究表明,基于多元组合数据增广的渔业标准命名实体识别方法有效解决了部分实体样本稀疏问题,提升了渔业标准命名实体识别的整体效果。  相似文献   

3.
《Planning》2022,(2)
为了解决基于分词的渔业领域命名实体识别效果受分词准确度影响这一问题,采用一种基于深度学习的渔业领域命名实体识别方法。该方法使用神经网络训练得到字向量作为模型输入,避免了分词不准确对渔业领域命名实体识别效果造成的影响;针对渔业领域命名实体长度较长这一特点,使用LSTM单元保持较长时间记忆信息,并将标记信息融入到CRF模型中构建Character+LSTM+CRF实体识别模型。为验证方法的有效性,在渔业领域语料集上进行多组实验,结果表明,本研究中提出的Character+LSTM+CRF方法具有较好的效果,与LSTM模型相比较,在准确率、召回率、F值上分别提升了3.39%、2.99%、3.19%,对于渔业领域实体识别具有较好的效果。  相似文献   

4.
《Planning》2018,(2)
为了解决基于分词的渔业领域命名实体识别效果受分词准确度影响这一问题,采用一种基于深度学习的渔业领域命名实体识别方法。该方法使用神经网络训练得到字向量作为模型输入,避免了分词不准确对渔业领域命名实体识别效果造成的影响;针对渔业领域命名实体长度较长这一特点,使用LSTM单元保持较长时间记忆信息,并将标记信息融入到CRF模型中构建Character+LSTM+CRF实体识别模型。为验证方法的有效性,在渔业领域语料集上进行多组实验,结果表明,本研究中提出的Character+LSTM+CRF方法具有较好的效果,与LSTM模型相比较,在准确率、召回率、F值上分别提升了3.39%、2.99%、3.19%,对于渔业领域实体识别具有较好的效果。  相似文献   

5.
《Planning》2019,(9):1201-1207
提出基于双向长短期记忆网络(bidirectional long short-term memory,Bi LSTM)和前向神经网络的融合模型完成公共安全事件的触发词识别任务.首先通过Bi LSTM提取整段文本的高层语义特征,避免了以往机器学习方法需要人工提取特征的问题,其次采用特征拼接并在前向神经网络中识别并分类事件触发词.实验结果表明相较于基准模型,本文方法在中文突发事件语料库(Chinese emergency corpus,CEC)上取得了更为突出的性能,Micro-F1值为78. 47%.此外本文讨论了不同拼接特征在触发词识别任务中的重要性,对文本分析中3类特征(词性、句法、实体)的重要程度进行了比较和分析,得出句法特征对于事件触发词识别任务助益最大的结论.  相似文献   

6.
《Planning》2022,(1)
中文文本实体识别,是自然语言处理的关键问题。传统的语言处理模型无法有效表示文本中的上下文语义信息,无法处理一词多义的不同语境,影响实体识别效果。提出了一种BERT-BiLSTM-CRF的实体识别模型,BERT预处理语言模型生成表征上下文语义信息的词向量,通过双向长短期记忆网络对生成的向量进行特征提取,自注意力机制能够有效获取文本语句中的长距离依赖,最后通过CRF进行解码生成实体标签序列。实验结果表明,该模型在微软亚洲研究院MSRA语料库和人民日报语料库上都取得了优异成绩,F1分别达到96.12%和95.88%。  相似文献   

7.
《Planning》2022,(4)
为解决用传统方法进行渔场预测时存在的性能欠佳、特征转换困难、拟合程度不足等问题,提出了一种基于深度学习和典型相关分析的新型渔情预测方法——CNN-DNN-CCA(连接融合)-RBF模型,该方法首先在5°×5°渔业作业区域内将不同海洋环境因子按相对空间位置映射为三维矩阵,然后分别采用卷积神经网络(CNN)和深度神经网络(DNN)对海表温度(SST)、叶绿素a(Chl-a)浓度、海面高度(SSH)3种环境因子和渔场时空因子两种多源异构数据进行模态特征提取,得到两种不同模态的特征向量,并将两种特征向量通过典型相关分析(CCA)进行特征级融合,最后将融合后的特征输入到径向基函数网络(RBF)中进行分类。结果表明,通过试验验证,基于深度学习和典型相关分析的渔场预报模型CNN-DNN-CCA(连接融合)-RBF对南太平洋长鳍金枪鱼Thunnus alalonga中心渔场的召回率达到了90.3%,相较于随机森林(RF)、CNN和DNN模型提高了6.8%~21.8%。研究表明,CNN-DNN-CCA(连接融合)-RBF新型渔情预测模型通过深度学习和典型相关分析方法分别进行特征自动提取和特征融合,消除了冗余信息,简化了特征转换,提高了运算速度和预测精度。  相似文献   

8.
《Planning》2019,(9):164-165
词性等特征在句子中扮演着重要的角色,往往能揭示命名实体之间的关系,而当前的实体关系抽取任务大多仅基于词向量进行,忽视了词性等对实体关系抽取任务有益的特征。因此,文章采用了一种多特征融合的方式进行中文实体关系抽取模型的训练,在以词向量作为输入单元的前提下融合了句子中词语的词性、距离实体对的位置、实体标注相关特征,并以双向长短期记忆网络结合注意力机制的模型进行了中文实体关系抽取的实验,实验结果表明,基于多特征融合的训练方式提升了中文实体关系抽取的效果。  相似文献   

9.
《Planning》2019,(5)
为解决动作识别问题,本文提出一种基于特征融合的方法。提取视频特征时,同时获得运动特征和表观特征,然后融合这两种特征训练SVM分类器。实验时,在J-HMDB数据集上获得了优异的表现,动作识别的精度可以达到94.8%。  相似文献   

10.
《Planning》2020,(1)
针对掌纹单特征提取方法提取的掌纹特征信息较为单一以及近年来掌纹特征融合方法在纹理特征提取过程计算量偏大和没有将掌纹感兴趣区域(ROI)的多种特征进行融合的缺陷,本文提出了一种掌纹主线和纹理特征融合的方法。利用数学形态学和基于统一模式的LBP算子分别提取增强的掌纹ROI的主线特征和纹理特征信息,再利用融合规则将两种特征信息进行融合。对各特征图进行直方图统计得到特征向量后输入SVM分类识别,再将识别率最高的特征图进行分块直方图统计,将所得特征向量输入到SVM进行分类识别并与其他方法作对比。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号