首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
事件抽取技术主要研究如何从非结构化自然语言文本中抽取用户感兴趣的事件信息。它是信息抽取领域的一个重要分支,近年来被广泛应用于情报分析、智能问答、信息检索和推荐系统等领域。文中从事件抽取技术概念和任务出发,对事件抽取技术的数据集和方法进行了全面综述,分析了事件抽取任务的技术研究进展,归纳总结了基于模式匹配、机器学习和深度学习的事件抽取方法;根据模型学习方式的不同和使用特征范围大小的差异,侧重介绍了基于深度学习的方法,探讨和分析了不同方法的优缺点;最后对现阶段研究面临的挑战和未来研究趋势进行归纳,针对现阶段事件抽取面临的低资源场景、模型可移植性低和篇章级事件抽取建模难度大等问题总结了当前的研究趋势。  相似文献   

2.
马春明  李秀红  李哲  王惠茹  杨丹 《计算机应用》2022,42(10):2975-2989
将用户感兴趣的事件从非结构化信息中提取出来,然后以结构化的方式展示给用户,这就是事件抽取。事件抽取在信息收集、信息检索、文档合成、信息问答等方面有着广泛应用。从全局出发,事件抽取算法可以分为基于模式匹配的算法、触发词法、基于本体的算法以及前沿联合模型方法这四类。在研究过程中根据相关需求可使用不同评价方法和数据集,而不同的事件表示方法也与事件抽取研究有一定联系;以任务类型区分,元事件抽取和主题事件抽取是事件抽取的两大基本任务。其中,元事件抽取有基于模式匹配、基于机器学习和基于神经网络这三种方式,而主题事件抽取有基于事件框架和基于本体两种方式。事件抽取研究在中英等单语言上均已取得了优秀成果,而跨语言事件抽取依然面临着许多问题。最后,总结了事件抽取的相关工作并提出未来研究方向,以期为后续研究提供参考。  相似文献   

3.
在当前互联网时代,大量新领域下的非结构文本数据中蕴含了海量信息.面向新领域的事件抽取方法研究能快速地构建领域知识库,用于支撑基于知识的下游应用.但现有事件抽取系统的领域限定性强,在新领域中从零构建会极度依赖事件体系和标注数据的质量及规模,需要大量人力和专家知识来定制模板和标注语料.而且数据集中常见在相同的上下文中出现多...  相似文献   

4.
基于事件框架的主题事件融合研究*   总被引:1,自引:0,他引:1  
针对事件抽取获得的单个元事件无法完整描述主题事件的特点,提出了一种主题事件的融合方法,通过该方法将与同一主题相关的所有元事件整合在一起,以层次化的形式表示。首先定义了一种事件融合框架TEFF(topic event fusion framework)。该框架根据各类元事件在主题事件中的作用,将主题事件以层次化的形式表示。同时给出元事件和主题的相关度计算方法,通过该算法来评价元事件和主题的相关度。在TEFF的指导下,通过相关度计算,实现主题事件的融合。在以2008年起的金融危机为主题的实验中,取得了F值为7  相似文献   

5.
世界是由无数相互关联的事件组成的,人们的社会活动也往往是由不同的事件来触发和驱动的。针对事件与事件之间关系的演化规律进行研究,不仅有助于人们认识和了解社会事件的演化规律与模式,同时也为基于人工智能的机器推理与思考提供了重要的决策支撑,并且已成为目前人们关注的研究前沿和新焦点。与传统的知识图谱不同,事件图谱是以现实世界中的抽象事件为节点,以不同事件之间的状态变化或动作序列等形成的逻辑关系来构建复合语义特征的知识网络,并在更高层语义条件下,通过抽象复杂的事件与事件间隐含的逻辑关系,刻画出事物发展演化的行为规律。在事件图谱构建方法的基础上,围绕开放域事件抽取、建立通用的事件标准、事件间关系抽取、事件图谱的融合与加工,以及事件图谱的表示学习等关键技术问题展开深入分析,并对目前相关领域中存在的核心技术、常见的评测数据集以及相关指标进行综述与总结,并对未来发展的新方向进行了展望。  相似文献   

6.
事件抽取旨在从非结构化的文本中抽取出人们感兴趣的事件信息并对其进行结构化表示。事件抽取具有广泛的应用,包括自动问答、机器翻译、推荐系统、信息检索、知识图谱构建等。现有的事件抽取研究综述,主要围绕句子级的事件抽取任务和实现方法展开。但事件的描述、事件元素和元素角色通常分布在整篇文档的多个句子中,更完整的事件抽取应从文档层面进行,即进行文档级事件抽取。近年来,随着深度学习技术的发展和多个文档级事件抽取数据集的公开发布,使文档级事件抽取受到了广泛的关注。该文对文档级事件抽取的相关研究进行了全面的综述:首先介绍了文档级事件抽取任务的定义和常用数据集,然后对典型方法进行了梳理和分析,最后对未来的研究方向进行了展望。  相似文献   

7.
事件抽取是信息抽取领域最具有挑战性的任务之一,也是知识图谱构建中的关键技术。事件抽取在阅读理解、文本摘要、问答系统等领域得到了广泛的应用。限定域事件抽取指的是系统所抽取的事件类型是预定义的,因此针对某一特定领域,限定域事件抽取的研究更具有研究价值,而且中文事件抽取由于中文语言特性问题,面临着较大挑战。介绍了中文事件抽取中面对的挑战,对限定域中文事件抽取的主要方法进行归纳总结,重点介绍了基于深度学习的方法,并总结了少样本情况下的事件抽取方法,介绍了中文事件抽取常用的数据集,展望了中文事件抽取未来的发展趋势。  相似文献   

8.
并行程序性能分析工具的一种主要设计思想是采用源程序们随法,而其中性能监测库是这类并行程序性能分析工具的重要组成部分,提出了玫种基于事件的并行程序性能监测库的实现技术,并给出了一个基于SVM系统的性能分析工具的性能监测库的实现方法。  相似文献   

9.
复合事件检测技术的综述与评价   总被引:4,自引:0,他引:4  
在大规模事件通知服务的通用框架基础上,通过分析提出了复合事件检测的基本模型,并对照该基本模型剖析了复合事件检测的四种基本方法:基于Petri网、基于匹配树、基于图以及基于自动机的检测方法,评价了各种方法的优缺点,为开发适用于新的应用需求的复合事件检测技术打下了基础。  相似文献   

10.
基于指代消解的中文事件融合方法   总被引:1,自引:0,他引:1  
事件抽取是信息抽取领域的一个重要的研究方向.针对事件抽取获得的信息不完整和语义不明确的特点,在此基础上引入指代消解和信息融合理论,通过事件元素归一化和互指事件的合并,在数据和特征两个层次上对事件信息进行融合,进一步明确和完善事件信息,并在不损失信息的情况下精简整个信息系统的信息量.在裁员事件的融合实验中正确率达到86.9%.  相似文献   

11.
为了有效检测移动计算环境中的事件,提出了基于Petri网的事件检测方式CCPN.该方式能直观灵活地建模事件,支持异步并发事件的检测以及时序事件的检测;讨论了主机断接以及移动情况下的事件检测.  相似文献   

12.
刘云生  刘方方 《计算机工程》2004,30(8):88-89,97
介绍了主动实时数据库中事件探测的实现方法,该方法既增强了系统处理时间事件的能力,也提高了系统处理其他事件的灵活性。该文还提出了基于多线程的时间事件探测模型,并提供了相应的算法.  相似文献   

13.
主动数据库中的复合事件构造与探测   总被引:2,自引:0,他引:2  
本文提出了主动数据库中复合事件的构造形式,对于复合事件的实现及探测,提出了基于“扩展语义树”处理的方法。  相似文献   

14.
Twitter is among the fastest‐growing microblogging and online social networking services. Messages posted on Twitter (tweets) have been reporting everything from daily life stories to the latest local and global news and events. Monitoring and analyzing this rich and continuous user‐generated content can yield unprecedentedly valuable information, enabling users and organizations to acquire actionable knowledge. This article provides a survey of techniques for event detection from Twitter streams. These techniques aim at finding real‐world occurrences that unfold over space and time. In contrast to conventional media, event detection from Twitter streams poses new challenges. Twitter streams contain large amounts of meaningless messages and polluted content, which negatively affect the detection performance. In addition, traditional text mining techniques are not suitable, because of the short length of tweets, the large number of spelling and grammatical errors, and the frequent use of informal and mixed language. Event detection techniques presented in literature address these issues by adapting techniques from various fields to the uniqueness of Twitter. This article classifies these techniques according to the event type, detection task, and detection method and discusses commonly used features. Finally, it highlights the need for public benchmarks to evaluate the performance of different detection approaches and various features.  相似文献   

15.
音乐领域典型事件抽取方法研究   总被引:1,自引:0,他引:1  
事件抽取是信息抽取领域一个重要的研究方向。该文从音乐领域的事件抽取出发,通过领域事件词聚类的方法自动发现音乐领域具有代表性的事件,然后采用基于关键词与触发词相结合的过滤方法简化了事件类型的识别过程。在事件元素识别中,该文采用了基于最大熵的事件元素识别方法。在该文构建的语料库下,最终事件类型识别的平均F值达到82.82%,事件元素识别的平均F值达到75.79%。  相似文献   

16.
倾斜问题是并行系统普遍存在的问题,对系统的性能影响很大.事件流数据库作为数据流应用的后端分析处理系统具有连续大量的事件流加载与用户查询并存的特点,传统的解决数据倾斜的方法无法适应其动态加载的特点.以主干网的网络安全监控应用为研究背景,结合事件流负载特征,针对基于无共享结构的事件流并行数据库提出了一种基于周期计数的能力感知加载均衡策略.该方法在保证加载性能的同时,可以根据加载节点的能力在线自动调解数据分布,不仅有效预防和解决了系统倾斜,还为查询服务的性能奠定了良好的基础.模拟分析和真实测试都证明这种加载均衡策略较其他策略更有效.  相似文献   

17.
入侵检测系统是当前计算机界研究的热点,但众多的设计方案更多偏重于算法上的改进,在实际应用中入侵检测技术还不成熟,面临瓶颈。分布式数据库由于其自身特性使得系统存取数据效率大大提高,所以如果将分布式数据库与入侵检测系统结合将可以有效提高入侵检测系统的性能。基于分布式数据库的入侵检测系统就是根据这种思想解决了从设计方法、存储模式、数据处理到实际应用的一系列问题,由此可以看出入侵检测系统的应用发展前景相当广阔,尝试通过局部的优化可以有效提高其应用效果。  相似文献   

18.
知识图谱以图结构表示丰富灵活的语义,描述客观世界的事物及其关系,在应用领域得到了广泛的关注。事件知识图谱聚焦动态事件及其间的顺承、时序和因果关系,并以结构化的图形式表示,对海量数据更高效地管理。尤其是对动态事件信息和事件逻辑关系的挖掘,对认识客观世界发展规律,助力领域多种智能应用有着重要的意义。本文系统阐述事件知识图谱的构建技术,包括事件知识表示、事件知识抽取、事件关系抽取,并介绍事件知识图谱在领域的典型应用,最后介绍现阶段的挑战与研究展望。  相似文献   

19.
事件检测是信息抽取领域的一个重要研究方向,目前的事件检测方法往往受限于数据稀疏、语料例句分布不平衡和歧义问题。该文研究发现框架语义知识库FrameNet(FN)含有丰富的已标注框架的语料,并且FN中定义的框架和事件检测中定义的事件具有极其相似的结构。框架由词法单元和一组框架元素组成,可与事件中的触发词和论元形成对应关系;而且,FN中的许多框架实际上也能表达某些事件。因此,该文利用这一相似性构建事件类型与框架类型的映射关系,从而选取FN中合适的例句作为事件检测的扩充语料,以此来优化事件检测性能。实验结果显示,针对触发词识别任务和事件类型识别任务,该文提出的框架语义辅助方法取得了较好的效果。  相似文献   

20.
基于电子病历观察性数据的真实世界研究成为目前临床科研的热点。然而关系数据模型无法直接支撑起科研应用中医疗事件的时序关系表示以及知识融合的查询需求。针对上述问题,该文提出了一种新的基于RDF的医疗观察性数据表示模型,该模型可以清晰地表示临床检查、诊断、治疗等多种事件类型以及事件的时序关系。对来源于医院的电子病历数据,经过数据预处理、数据模式转换、时序关系构建以及知识融合4个步骤建立事件图谱。具体地,使用三家上海三甲医院的电子病历数据,构建了包括3个专科、173 395个医疗事件以及501 335个事件时序关系的医疗数据集,并融合了5 313个中文医疗知识库概念。基于临床文献与医生科研需求,该文根据公共卫生流行病学的病因研究、治疗研究等类型,分别提供了针对本数据集的40个问题示例,并将其中的部分问题与传统关系数据库在查询的构建与执行方面进行了实验比对,论证了该事件图谱的优越性。该数据集遵循开放链接标准,在OpenKG上发布并提供了在线访问的SPARQL站点,链接为 https://peg.ecustnlplab.com/dataset.html。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号