首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
事件抽取作为信息抽取的重要一环,是非结构化文本转化为有价值的结构化文本的主要方式。针对目前事件抽取模型普遍训练时间长、模型体量大等问题,提出了一个基于ABBSAC的中文事件抽取模型。通过ALBERT预训练模型缩减模型体量,采用BiSRU++捕捉文本内部关联信息,并融合注意力机制提升模型精度,最后以CRF的输出作为抽取结果。基于新浪新闻自主构建了语料集,进行了对比实验。在获得较高准确率、召回率以及F1值的基础上,该模型训练速度提高了约10%,模型参数量裁剪了约82%,证明了所提模型的先进性。同时,在ACE05和DUEE基准测评数据集上,与前沿方法相比较,将触发词抽取的F1值分别提升了1.7%、0.3%,将论元角色抽取的F1值分别提升了5.4%、0.1%,有效提升了中文事件抽取任务的效能。  相似文献   

2.
事件抽取是信息抽取研究领域中的一个关键问题。针对采用传统的自我训练方法进行泰语新闻事件抽取,具有错误从上向下传播导致事件抽取系统性能不高的问题,针对这一问题,文中提出一种新的引导框架来进行泰语新闻事件抽取,即跨语言信息投影。该方法将从中文事件抽取系统中获取的信息映射为泰语,并采用结合单语与跨语言半协同训练的方法进行泰语新闻事件抽取。最后通过实验验证了本文所提方法是可行的,并且显著地提高了泰语新闻事件抽取的性能。  相似文献   

3.
目前,情感分析是自然语言处理领域的一个重要方向.作为其中一种特殊的修辞手法,反讽尤其是中文反讽目前国内相关研究较少,存在反讽识别准确率不高的问题.为了提高中文反讽识别的准确性,研究了一种改进后的融合微博特有语言特征的词袋模型,并分别在支持向量机(Support Vector Machine,SVM)、朴素贝叶斯(Nai...  相似文献   

4.
事件抽取是信息抽取领域一个重要研究方向,对信息检索、自动问答、舆情分析等领域均有很高的应用价值.传统事件抽取方法大多采用人工构建的方式进行特征表示,并通过分类模型进行事件触发词分类和论元角色识别.近年来,神经网络方法在图像分类、语音识别和自然语言处理等领域展现了突出的效果.神经网络方法的优势在于能够自动学习构建特征,从而避免了繁琐的特征工程.本文将对神经网络事件抽取技术进行系统论述,并展望未来的研究方向.  相似文献   

5.
利用语义角色分析的方法对动态新闻进行事件抽取研究。通过对句子进行论元结构标注,抽取出句子中以谓语动词为中心的论元结构,将其转化为具体的语义角色,并与事件要素进行匹配,完成事件抽取工作。论文提出并重点研究了如何利用VerbNet和SemLink资源对动词的论元结构与事件要素进行匹配。抽取系统基于该方法对1 000篇新闻语料进行了事件抽取实验,结果表明该方法的F值达到70.6%,具有一定的应用价值。  相似文献   

6.
基于特征组合的中文实体关系抽取   总被引:2,自引:0,他引:2  
结合中文关系抽取的要求,以ACE2005的中文语料为数据进行关系抽取实验.在抽取中文词法、实体、句法,语法基本特征后,提出采用特征组合方法,使用支持向量机的机器学习(SVM)方法,在上关系探测和关系大类上F值分别提高了1.36%和3.97%,达到72.77和61.03,并分析出各部分组合特征的贡献.实验数据表明词语和实体组合特征对中文关系抽取的作用较大.  相似文献   

7.
采用基于BootStrapping的方法实现中文事件元素抽取系统.其中,将事件元素抽取定义为一个模式匹配问题.针对这一问题,首先构建了初始种子集,然后创新性地引入了BootStrapping方法构建模板集,并使用模式匹配的方法进行事件元素抽取.在模板构造过程中,提出了基于BestMatch的模板泛化算法[1].对任意两个事件实例模板[2]进行匹配,计算其匹配代价并泛化,提高了模板的覆盖能力.所实现的系统在ACE 2005语料测试中取得了不错结果.  相似文献   

8.
本文提出了一种新型的二进制框架BinaryEE。首先,利用相似度函数衡量句子中存在的事件类型,然后利用注意力机制的序列标注模型抽取事件触发词和事件元素。另在一个公共的事件抽取数据集FewFC进行评估。实验表明,与之前的方法相比,BinaryEE在重叠事件抽取问题上实现了良好的效果。  相似文献   

9.
随着数据存储和数据处理技术的不断进步,个人信息广泛存在于各类文档之中,个人信息保护已成为目前科研界和工业界亟待解决的重要问题,而个人信息抽取是个人信息保护的前提和核心概念之一。针对内容复杂,格式多样,不确定性高的各类复杂文档进行个人信息抽取,本文提出了一种基于神经网络的个人信息自动化抽取的统一方法。该方法整合了流式文档和版式文档的信息抽取能力,同时结合了正则匹配和深度学习神经网络模型来输出个人信息抽取结果。此外,方法中的个人信息抽取模型通过改造输入数据的方式来融合文档的布局信息进行训练,并在训练过程中采取了迭代标注和扩展训练数据的方法,以此提高模型训练的效率和效果。  相似文献   

10.
11.
基于隐马尔可夫模型的中文文本事件信息抽取   总被引:2,自引:2,他引:2  
提出了一种基于隐马尔可夫模型的中文文本事件抽取方法,该方法首先通过触发词探测从文本中发现特定的候选事件语句,然后利用隐马尔可夫模型从这些语句中抽取每个候选事件的事件要素,为每一类事件要素构建一个独立的隐马尔可夫模型用于该类事件要素的抽取,构建模型的关键是模型结构的学习和参数估计。实验结果表明,该方法能较好地实现中文文本事件抽取,较其他方法有更好的抽取性能。  相似文献   

12.
本文首先介绍了自然语言处理的概念,并给出了自然语言处理模型,与此同时,分析了依存句法的有关问题,包括其公理以及具体分析方法等,最后阐述了基于依存句法的实体关系抽取过程。  相似文献   

13.
医疗事件抽取是构建医疗知识图谱的重要基础.针对医疗领域有标签数据匮乏的问题,构建基于Transformer编码器、BiLSTM和注意力机制的医疗事件联合抽取模型,并提出一种用于选择高置信度数据的伪标签置信选择算法.首先,训练医疗事件联合抽取模型对无标签数据进行预测产生伪标签数据;然后,通过计算伪标签一致概率P来选择高置...  相似文献   

14.
关系抽取是信息抽取中的一个重要子任务,很多关系抽取任务利用现有的词法分析和句法分析等基本的NLP处理工具来生成特征,但是该特征提取方法完全利用之前的经验进行,特征的质量过度依赖于已有的NLP工具的准确率,存在误差传播的问题.近年来随着深度学习的发展,卷积神经网络学习算法在很多自然语言处理任务中取得了较好的效果.文中应用...  相似文献   

15.
系统揭示深度学习主流模型的原理,并探究其在有监督实体关系抽取任务中的效果差异.对目前的主流技术范式、关键技术、研究进展和存在的问题进行了分析总结,然后以有监督的实体关系抽取任务为基础,对比研究了几种典型的深度学习模型和预训练语言模型,对其有效性进行了实验分析.不同模型关系抽取准确率在关系种类上的分布也有较大差异,BER...  相似文献   

16.
传统方法对微博舆情事件情感分析缺乏深层次语义支持,且特征稀疏、上下文关系单薄,导致情感分类准确率较低,无法第一时间感知舆情突发事件.针对这些问题,提出一种基于TextCNN和注意力机制的舆情事件情感分析模型.首先采集微博舆情事件文本知识并进行数据预处理,接着利用TextCNN模型的卷积层和池化层从多个角度提取局部特征,...  相似文献   

17.
关系抽取是信息抽取技术的重要环节,旨在从无结构的文本中抽取出实体之间的关系.目前基于深度学习的实体关系抽取已经取得了一定的成果,但其特征提取不够全面,在各项实验指标方面仍有较大的提升空间.实体关系抽取不同于其他自然语言分类和实体识别等任务,它主要依赖于句子和两个目标实体的信息.本文根据实体关系抽取的特点,提出了SEF-...  相似文献   

18.
事件论元抽取任务的目标是识别事件中的论元和论元角色。中文由于其独特的表达习惯,存在句法结构较为松散的问题,导致事件的隐层语义关系不易被捕捉,而这些隐层语义关系对事件论元抽取有关键作用。文章提出一种基于依存感知建模的事件论元抽取方法。首先,通过依存感知建模捕获依存感知特征;然后,构建上下文语义增强向量经过序列编码后得到上下文语义增强特征;最后,采用多头注意力机制融合特征,并通过softmax函数进行分类。在CEC2.0中文语料库上的实验结果表明,该方法较好地提高了事件论元抽取性能。  相似文献   

19.
针对电信标准地址体系分级准确性不高的问题,探讨了当前企业地址分级算法的不足和深度学习算法的实际应用情况,使用自然语言处理技术,基于循环神经网络和条件随机场算法,设计了电信标准地址分级模型,实现了地址数据层级的准确划分。结果表明,基于循环神经网络和条件随机场的标准地址分级方法在地址层级划分准确率上有较高的性能。  相似文献   

20.
基于层叠条件随机场模型的中文机构名自动识别   总被引:38,自引:1,他引:38  
中文机构名的自动识别是自然语言处理中的一个比较困难的问题.本文提出了一种新的基于层叠条件随机场模型的中文机构名自动识别算法.该算法在低层条件随机场模型中解决对人名、地名等简单命名实体的识别,将识别结果传递到高层模型,为高层的机构名条件随机场模型实现对复杂机构名的识别提供决策支持.文中为机构名条件随机场模型设计了有效的特征模板和特征自动选择算法.对大规模真实语料的开放测试中,召回率达到90.05%,准确率达到88.12%,性能优于其它中文机构名识别算法.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号