首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
现有法语命名实体识别(NER)研究中,机器学习模型多使用词的字符形态特征,多语言通用命名实体模型使用字词嵌入代表的语义特征,都没有综合考虑语义、字符形态和语法特征。针对上述不足,设计了一种基于深度神经网络的法语命名实体识别模型CGC-fr。首先从文本中提取单词的词嵌入、字符嵌入和语法特征向量;然后由卷积神经网络(CNN)从单词的字符嵌入序列中提取单词的字符特征;最后通过双向门控循环神经网络(BiGRU)和条件随机场(CRF)分类器根据词嵌入、字符特征和语法特征向量识别出法语文本中的命名实体。实验中,CGC-fr在测试集的F1值能够达到82.16%,相对于机器学习模型NERC-fr、多语言通用的神经网络模型LSTM-CRF和Char attention模型,分别提升了5.67、1.79和1.06个百分点。实验结果表明,融合三种特征的CGC-fr模型比其他模型更具有优势。  相似文献   

2.
陈佳沣  滕冲 《计算机应用》2019,39(7):1918-1924
针对现有的基于远程监督的实体和关系抽取方法存在着标签噪声问题,提出了一种基于强化学习的实体关系联合抽取方法。该模型有两个模块:句子选择器模块和实体关系联合抽取模块。首先,句子选择器模块选择没有标签噪声的高质量句子,将所选句子输入到实体关系联合抽取模型;然后,实体关系联合抽取模块采用序列标注方法对输入的句子进行预测,并向句子选择器模块提供反馈,指导句子选择器模块挑选高质量的句子;最后,句子选择器模块和实体关系联合抽取模块同时训练,将句子选择与序列标注一起优化。实验结果表明,该模型在实体关系联合抽取中的F1值为47.3%,与CoType为代表的联合抽取模型相比,所提模型的F1值提升了1%;与LINE为代表的串行模型相比,所提模型的F1值提升了14%。结果表明强化学习结合实体关系联合抽取模型能够有效地提高序列标注模型的F1值,其中句子选择器能有效地处理数据的噪声。  相似文献   

3.
近年来,在大规模标注语料上训练的神经网络模型大大提升了命名实体识别任务的性能.但是,新领域人工标注数据获取代价高昂,如何快速、低成本地进行领域迁移就显得非常重要.在目标领域仅给定无标注数据的情况下,该文尝试自动构建目标领域的弱标注语料并对其建模.首先,采用两种不同的方法对无标注数据进行自动标注;然后,采用留"同"去"异...  相似文献   

4.
命名实体识别任务常常因训练数据类别不平衡,导致模型泛化能力较差。该文提出了一种新的机器阅读理解(Machine Reading Comprehension, MRC)模型框架,使其可以同时识别多个首尾索引以提取多个实体文段,并在此MRC模型基础上,针对数据不平衡问题,提出动态数据生成方法(Dynamic Data Generation method, DDG),使用MRC模型动态地生成用于训练和预测的数据,以辅助序列标注(Sequence Labeling)模型进行命名实体识别。该文分别在中英文数据集上进行了实验,并且在Weibo数据集上取得优于当前SOTA模型+1.93%F1值的结果。  相似文献   

5.
科学技术的进步,推进着军事武器装备的快速更新. 在高度信息化的时代,急需智能化军事信息处理技术. 本文针对飞行器、坦克车辆、火炮弹炮、导弹武器等军事文本中的武器命名实体,提出了基于词向量、词状态的特征,利用深度神经网络模型的识别方法. 实验表明:在测试语料上取得F-1值0.9102的效果.  相似文献   

6.
现有的信息抽取工作多是针对无层次结构的数据信息,而在实际任务中,文本中的数据常常具有复杂的嵌套层次结构,如文档中包含多个不同类型的信息块序列,每个块中又包含了一个独立的信息序列.针对具有层级结构的信息抽取问题,提出一种基于联合序列标注的层级信息抽取方法.一方面使用BiLSTM-CNN-CRF模型分别对不同层级的数据进行...  相似文献   

7.
药物实体及关系抽取研究对于生物医学研究具有重要的促进作用,也是进一步构建生物医学知识库的基础.现存方法主要采用流水线方式,即先对文本进行实体识别后再对实体对进行关系分类.流水线方法主要存在任务错误传播、未能考虑2个子任务的相互影响和句子中不同关系的相互影响的问题.针对这些问题,提出了一种基于神经网络的药物实体与关系联合抽取方法.使用了一种新标注模式,将药物实体及关系的联合抽取转化为端对端的序列标注任务.使用词向量和字符向量作为词表示输入,使用BiLSTM-CRF模型进行药物实体与关系联合抽取.实验结果表明:在药物-药物交互作用(drug-drug interactions, DDI)2013语料集上,取得了89.9%的实体识别F-score及67.3%的关系抽取F-score,优于使用相同模型的流水线方法.  相似文献   

8.
9.
相对于英文天然由单词组成而言,中文由于没有分词符,汉字之间的组词更灵活,在命名实体识别时,其边界更加难以确定。当前的主流方法将命名实体识别任务转化为序列标注任务,文中采用BIOES标注方案,针对预测的标签序列进行研究。通过单独比较实体头部标签B或尾部标签E,计算实体边界准确率,结果表明提高边界准确率能够进一步提升实体识别准确率;对具有连续标签的实体边界进行拓展和重定位,采用实体最后一个字符的类型标签对实体类型进行纠偏,利用分词信息对标签不完整的实体进行填充;最后,提出增加边界标记的BIO+ES标注方案,用于区分实体边界的非实体字符,以进一步提升中文命名实体识别的性能。  相似文献   

10.
本研究利用JASIST数据库学术论文,制定软件实体标注规则,实现网站标注系统并手工标注程序,制定机器学习模型的特征模板.利用条件随机场模型构建软件实体识别自动抽取模型和人工的软件实体数据集合.对软件实体词频次数、左右词性进行统计,调用条件随机场模型进行训练,评测测试文本的P、R、F值,从中总结相应的规律结论,最后改变特征模板,对比增加词性后软件实体抽取指标值是否有所改进.  相似文献   

11.
针对目前旅游领域实体对齐任务中的长尾实体过多和现有知识以及标注数据稀缺的问题,提出一种基于多视图知识表示和神经网络相结合的实体对齐方法。采用预训练模型完成多视图的知识表示学习,获得了实体的结构嵌入、关系嵌入和描述信息嵌入,然后利用卷积神经网络对结合了三种视图嵌入的实体综合嵌入进行相似度计算。实验精准率达到91.4%、召回率达到87.9%、综合指标F1值达到89.6%。结果表明,该方法有效地完成了旅游领域的实体对齐任务。  相似文献   

12.
基于神经网络集成技术构建IDSS知识库的研究   总被引:1,自引:0,他引:1  
高广耀  王世卿 《计算机工程与设计》2005,26(8):2083-2085,2173
神经网络集成通过训练多个神经网络并将其结果进行合成,可以显著地提高学习系统的泛化能力,有助于工程技术人员利用神经网络技术来解决真实世界中的问题。在分析智能决策支持系统(IDSS)目前面临问题基础上,论述了神经网络集成实现的方法,对神经网络集成技术在构建IDSS知识库中的应用进行了研究,并成功进行了实现。  相似文献   

13.
近年来,网络安全威胁日益增多,数据驱动的安全智能分析成为网络安全领域研究的热点。特别是以知识图谱为代表的人工智能技术可为多源异构威胁情报数据中的复杂网络攻击检测和未知网络攻击检测提供支撑。网络安全实体识别是威胁情报知识图谱构建的基础。开放网络文本数据中的安全实体构成非常复杂,导致传统的深度学习方法难以准确识别。在BERT(pre-training of deep bidirectional transformers)预训练语言模型的基础上,提出一种基于残差空洞卷积神经网络和条件随机场的网络安全实体识别模型 BERT-RDCNN-CRF。通过BERT模型训练字符级特征向量表示,结合残差卷积与空洞神经网络模型有效提取安全实体的重要特征,最后通过CRF获得每一个字符的BIO标注。在所构建的大规模网络安全实体标注数据集上的实验表明,所提方法取得了比LSTM-CRF模型、BiLSTM-CRF模型和传统的实体识别模型更好的效果。  相似文献   

14.
基于神经网络的多元特征融合身份识别系统   总被引:2,自引:2,他引:0  
从信息融合的角度出发,利用神经网络的方法将语音信号、人脸图像等多元特征数据信息有机地结合起来,设计并实现了一种基于神经网络的智能融合身份识别系统。系统利用改进的线性预测和轮廓检测等方法,求出3类特征参数,并将它们进行关联,最后利用RBF人工神经网络进行融合识别。实验表明,与传统的单一特征识别系统相比,该方法具有更好的识别效果。  相似文献   

15.
基于模糊混沌神经网络的人脸识别算法   总被引:1,自引:1,他引:0  
庞春江  高婉青 《计算机应用》2008,28(6):1549-1551
利用混沌对初值的极端敏感依赖性,可以对仅有微小差别的模式进行识别。提出一种基于模糊混沌神经网络的算法,并应用到人脸识别中。由于引入了混沌噪声,可使网络具有很强的抗干扰能力,能有效避免人脸图像光照、姿态等因素对人脸识别的影响,也避免了复杂的特征提取工作。利用ORL人脸图像数据库进行了仿真实验,结果表明,混沌神经网络算法精度高、迭代步骤少、收敛快,混沌神经网络应用于人脸识别是有效的,能提高识别率。  相似文献   

16.
在现有RBF神经网络基础上引入情感因子,提出了一种情感径向基神经网络(EMRBF),给出了EMRBF的结构,定义了新的训练准则函数,推导出了EMRBF网络权值训练算法,把EMRBF网络用于人脸识别系统。先采用PCA和LDA相结合进行人脸特征提取.然后设计EMRBF人脸分类器。在ORL人脸库上的实验结果表明,EMRBF网络的识别率达到98%,与普通RBF神经网络相比,性能明显提高。  相似文献   

17.
毕峰 《计算机应用》2007,27(6):1497-1499
分别利用BP神经网络与单输出型神经网络对已经得到的血细胞特征参数进行计算,设计出分类器对血细胞进行自动分类识别。单输出型神经网络分类器与BP神经网络分类器相比,具有设计简单、收敛速度快、识别精度高且更加稳健的优点,取得了较好的应用效果。  相似文献   

18.
19.
为了减少传统的命名实体识别需要人工制定特征的大量工作,通过无监督训练获得军事领域语料的分布式向量表示,采用双向LSTM递归神经网络模型解决军事领域命名实体的识别问题,并且通过添加字词结合的输入向量和注意力机制对双向LSTM递归神经网络模型进行扩展和改进,进而提高军事领域命名实体识别。实验结果表明,提出的方法能够完成军事领域命名实体的识别,并且在测试集语料上的F-值达到了87.38%。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号