首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 218 毫秒
1.
事件抽取技术主要研究如何从非结构化自然语言文本中抽取用户感兴趣的事件信息。它是信息抽取领域的一个重要分支,近年来被广泛应用于情报分析、智能问答、信息检索和推荐系统等领域。文中从事件抽取技术概念和任务出发,对事件抽取技术的数据集和方法进行了全面综述,分析了事件抽取任务的技术研究进展,归纳总结了基于模式匹配、机器学习和深度学习的事件抽取方法;根据模型学习方式的不同和使用特征范围大小的差异,侧重介绍了基于深度学习的方法,探讨和分析了不同方法的优缺点;最后对现阶段研究面临的挑战和未来研究趋势进行归纳,针对现阶段事件抽取面临的低资源场景、模型可移植性低和篇章级事件抽取建模难度大等问题总结了当前的研究趋势。  相似文献   

2.
事件抽取是构建知识图谱的关键任务之一,也是当前自然语言处理的研究热点和难点问题。事件抽取研究从非结构化的自然语言文本中自动抽取用户感兴趣的事件信息,对人们认知世界有着深远的意义,在信息检索、智能问答、情感分析等应用场景有着重要的意义和价值。在公开国际测评和语料的推动下,事件抽取研究受到越来越多的学者关注,取得了许多的研究成果。按照事件抽取任务定义,有预先定义结构化的事件表示框架的框架表示事件抽取和通过事件实例中触发词及事件元素进行聚类的实例表示事件抽取。根据事件抽取方法的不同,可以分为基于模式匹配的方法和基于机器学习的方法两大类,中文事件抽取方法还要考虑中文语言特性问题。文中全面介绍了中文事件抽取的任务和方法,并总结展望了未来的发展趋势。  相似文献   

3.
事件抽取是从非结构化的自然语言文本中自动抽取用户感兴趣的事件信息, 并以结构化的形式表示出来. 事件抽取是自然语言处理与理解中的重要方向, 在政府公共事务管理、金融业务、生物医学等不同领域有着很高的应用价值. 根据对人工标注数据的依赖程度, 目前基于深度学习的事件抽取方法主要分为两类: 有监督和远程监督学习方法. 对当前深度学习中事件抽取技术进行了全面的综述. 围绕有监督中CNN、RNN、GAN、GCN与远程监督等方法, 系统地总结了近几年的研究情况, 并对不同的深度学习模型的性能进行了详细对比与分析. 最后, 对事件抽取面临的挑战进行了分析, 针对研究趋势进行了展望.  相似文献   

4.
事件抽取旨在从非结构化文本中抽取出结构化事件信息,以便清晰、方便、直观地掌握并利用相关的关键信息。传统机器学习方法依赖于特征工程,利用人工构建的特征来进行事件抽取。而基于深度学习的方法利用CNN、RNN、GNN等深层神经网络通过提取重要特征来展开,但其依赖于大量的标注数据。近年来,研究者开始利用基于Transformer架构的大规模语言模型如BERT、GPT等采用预训练+微调范式来进行事件抽取并取得显著成效。而最近推出的大模型ChatGPT采用预训练+提示学习范式在自然语言处理领域取得显著成效,可以实现高效准确地抽取出关键的事件信息,将其应用到军事领域会产生重大影响。  相似文献   

5.
信息提取的目的是从自然语言文件中找到具体信息,现有研究在信息抽取的实体关系和事件抽取任务中仅解决事件论元重叠和实体关系重叠的问题,未考虑两个任务共有的角色重叠问题,导致抽取结果准确率降低。提出一个两阶段的通用模型用于完成实体关系抽取和事件抽取子任务。基于预训练语言模型RoBERTa的共享特征表示,分别对实体关系/事件类型和实体关系/事件论元进行预测。将传统抽取触发词任务转化为多标签抽取事件类型任务,利用多尺度神经网络进一步提取文本特征。在此基础上,通过抽取文本相关类型的事件论元,根据论元角色的重要性对损失函数重新加权,解决数据不平衡、实体关系抽取和事件抽取中共同存在论元角色重叠的问题。在千言数据集中事件抽取和关系抽取任务测试集上的实验验证了该模型的有效性,结果表明,该模型的F1值分别为83.1%和75.3%。  相似文献   

6.
篇章级事件抽取是一项面向多个句子长文本的事件抽取任务,现有的篇章级事件抽取研究一般将事件抽取分为候选实体抽取、事件检测和论元识别3个子任务,且通常采用联合学习的方式进行训练。然而,已有篇章级事件抽取方法大都采用逐句的方式抽取候选实体,未考虑跨句的上下文信息,明显降低了实体抽取和论元识别的精度,影响了最终的事件抽取效果。基于此,文中提出了一种基于多粒度实体异构图的篇章级事件抽取方法。该方法分别采用Transformer和RoBerta两个独立的编码器进行句子级和段落级实体抽取;同时,提出了多粒度实体选择策略,从句子实体集和段落实体集中选择更可能是论元的实体,并进一步构造融入多粒度实体的异构图;最后,利用图卷积网络获得具有篇章级上下文感知的实体和句子表示,进行事件类型和事件论元的多标签分类,实现事件检测和论元识别。在ChFinAnn和Duee-fin数据集上进行了实验,结果表明,所提方法比以往的方法在F1值方面分别提高了约1.3%和3.9%,证明了该方法的有效性。  相似文献   

7.
事件抽取旨在从非结构化的文本中抽取出人们感兴趣的事件信息并对其进行结构化表示。事件抽取具有广泛的应用,包括自动问答、机器翻译、推荐系统、信息检索、知识图谱构建等。现有的事件抽取研究综述,主要围绕句子级的事件抽取任务和实现方法展开。但事件的描述、事件元素和元素角色通常分布在整篇文档的多个句子中,更完整的事件抽取应从文档层面进行,即进行文档级事件抽取。近年来,随着深度学习技术的发展和多个文档级事件抽取数据集的公开发布,使文档级事件抽取受到了广泛的关注。该文对文档级事件抽取的相关研究进行了全面的综述:首先介绍了文档级事件抽取任务的定义和常用数据集,然后对典型方法进行了梳理和分析,最后对未来的研究方向进行了展望。  相似文献   

8.
事理图谱是研究事物动态发展的有效手段。针对金融因果事理图谱构建过程中数据集匮乏及构建方案缺少实践对比的现状,该文面向金融领域中发生频率较高的热点事件,研究构建事理图谱的方法。该文提出了一种新的金融领域事件论元的定义,制定了基于ATT+SBV结构的句法分析方案,针对信息抽取任务提出了面向金融因果事件的序列标注定义。该文同时提出了一种基于BERT+Bi-LSTM+CRF模型的信息抽取方案,并与不同神经网络模型进行对比研究。实验结果表明,该模型在信息抽取任务中,F1值达到95.78%,准确性有较大提升。该文通过Neo4j图数据库存储并构建金融因果事理图谱,以事件关系可视化的方式揭示现实金融事件的演变逻辑规律,分析金融网络的风险传导扩散机制。  相似文献   

9.
赵江江  秦兵 《电脑学习》2012,2(1):16-17,20
采用基于BootStrapping的方法实现中文事件元素抽取系统。其中,将事件元素抽取定义为一个模式匹配问题。针对这一问题,首先构建了初始种子集,然后创新性地引入了BootStrapping方法构建模板集,并使用模式匹配的方法进行事件元素抽取。在模板构造过程中,提出了基于BestMatch的模板泛化算法[1]。对任意两个事件实例模板[2]进行匹配,计算其匹配代价并泛化,提高了模板的覆盖能力。所实现的系统在ACE 2005语料测试中取得了不错结果。  相似文献   

10.
事件抽取作为自然语言处理的研究热点之一,其可以从海量数据中提取出有价值的信息,并以结构化的形式展现给用户,在舆情监控、信息检索、金融风投等方面有着广阔的应用前景以及巨大的应用价值。随着深度学习的发展,基于深度学习的事件抽取方法受到越来越多研究人员的关注。通过事件抽取的任务定义,描述基于深度学习事件抽取现有的研究理论;通过分析不同神经网络模型构成的事件抽取方法,探究基于深度学习事件抽取的处理思路,并根据不同的处理思路,将深度学习的事件抽取方法进行分类。在每个分类中,对最经典的研究工作从其问题来源、解决方案、贡献以及缺陷不足进行详细的分析;通过事件抽取数据集的介绍,说明当前事件抽取的研究基础;通过在不同数据集上的事件抽取性能表现,归纳当前事件抽取的发展现状。在此基础上,对当前深度学习应用于事件抽取所面临的困难和挑战进行总结与分析,并对事件抽取的发展前景进行展望。  相似文献   

11.
事件抽取是信息抽取领域最具有挑战性的任务之一,也是知识图谱构建中的关键技术。事件抽取在阅读理解、文本摘要、问答系统等领域得到了广泛的应用。限定域事件抽取指的是系统所抽取的事件类型是预定义的,因此针对某一特定领域,限定域事件抽取的研究更具有研究价值,而且中文事件抽取由于中文语言特性问题,面临着较大挑战。介绍了中文事件抽取中面对的挑战,对限定域中文事件抽取的主要方法进行归纳总结,重点介绍了基于深度学习的方法,并总结了少样本情况下的事件抽取方法,介绍了中文事件抽取常用的数据集,展望了中文事件抽取未来的发展趋势。  相似文献   

12.
一种基于角色匹配的事件抽取方法   总被引:1,自引:0,他引:1  
事件抽取是信息抽取领域一个重要的研究方向,事件抽取模式的定义和获取是其中的一个关键问题。提出了一种基于动词论元结构层次模型,将事件元素与动词的语义角色相对应,在实体、词性、关键词层次对事件元素进行语义约束的事件抽取模式定义方法。另外,为减轻模式建设的代价,提出了一种从标注语料中自动归纳事件抽取模式的方法。在此基础上,以发布事件为实例构建了实验系统,实验结果表明该方法的F指数达到71.7%。  相似文献   

13.
基于CRFs和跨事件的事件识别研究   总被引:1,自引:0,他引:1       下载免费PDF全文
事件检测与类型识别是事件抽取的基础,具体实施分为触发词检测和事件类型识别2个阶段。分别对2个阶段进行研究,在前一阶段,针对词形特征过拟和问题,提出利用LDA模型对词语聚类的方法,考虑到中文自动分词与标注的触发词边界的不一致性,提出基于CRFs模型的触发词识别方法。在后一阶段,为提高事件类型识别的效果,将跨事件理论应用于中文事件类型识别。实验结果表明,该方法能提高系统性能,F值分别提高到66.3和62.0。  相似文献   

14.
音乐领域典型事件抽取方法研究   总被引:1,自引:0,他引:1  
事件抽取是信息抽取领域一个重要的研究方向。该文从音乐领域的事件抽取出发,通过领域事件词聚类的方法自动发现音乐领域具有代表性的事件,然后采用基于关键词与触发词相结合的过滤方法简化了事件类型的识别过程。在事件元素识别中,该文采用了基于最大熵的事件元素识别方法。在该文构建的语料库下,最终事件类型识别的平均F值达到82.82%,事件元素识别的平均F值达到75.79%。  相似文献   

15.
事件抽取是自然语言处理领域的一项基本任务。以问题回答模式进行事件抽取可以解决传统事件抽取方法存在的无法捕捉到不同事件类型中具有相似性的参数角色的语义信息等问题。目前相关学者以该模式提出的英文事件抽取方法受语言壁垒限制,其提出的问题模板在中文文本上提取效果不理想。为解决此问题,设计了一套符合中文事件抽取的问题模板的生成规则,选择BERT预训练模型作为中文事件抽取的基础模型,将问题回答模式应用到中文事件抽取任务中,并在ACE2005中文数据集进行测试。结果显示,在触发词识别、触发词分类、论元参数识别和论元参数的评价指标上,F1值分别达到77.7%、68.5%、51.5%和48.0%,在一定程度上验证了设计的问题模板的生成规则的有效性以及将问题回答模式应用到中文事件抽取任务中具有良好的抽取性能。  相似文献   

16.
基于指代消解的中文事件融合方法   总被引:1,自引:0,他引:1  
事件抽取是信息抽取领域的一个重要的研究方向.针对事件抽取获得的信息不完整和语义不明确的特点,在此基础上引入指代消解和信息融合理论,通过事件元素归一化和互指事件的合并,在数据和特征两个层次上对事件信息进行融合,进一步明确和完善事件信息,并在不损失信息的情况下精简整个信息系统的信息量.在裁员事件的融合实验中正确率达到86.9%.  相似文献   

17.
事件抽取是信息抽取的主要任务之一,而触发词抽取是事件抽取的重要子任务.事件要素与事件触发词之间存在关联信息,现有的事件触发词抽取方法主要关注事件触发词本身,没有充分的利用事件要素信息.因此,提出一种事件要素注意力与编码层融合的事件触发词抽取模型,能够有效地利用事件要素信息,提高触发词抽取性能.通过事件要素与事件触发词之...  相似文献   

18.
事件挖掘就是从大量的、不完全的、人们事先不知道的,但同时又是潜在有用的信息中提取有用信息并概括为事件的过程。由于事件挖掘相对于话题检测与跟踪、信息检索、信息抽取等自然语言处理具备许多共性,并且具备预测事件发展的优越性,因此逐渐成为当前事件识别领域的研究热点。本文介绍事件挖掘相关研究的历史发展与应用背景,全新定义事件挖掘的概念与任务,并详细介绍事件挖掘任务相关的各种关键算法,尤其是语义链算法。指出事件挖掘的重要意义及其未来的发展趋势。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号