首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 140 毫秒
1.
徐建民  孙晓磊  吴树芳 《计算机应用》2013,33(10):2807-2810
针对互联网新闻事件追踪,结合时间信息提出了一种用于事件追踪的动态模型。该模型将时间因素加入到传统向量模型中,在此基础上得到文档与事件包含的相同特征词之间的时间相似度,并将其应用于文档与事件的相关性计算。若文档与事件相关,则把文档中新的特征词加入事件特征词集并重新调整事件特征词集中特征词的权重和时间信息。实验采用检测错误权衡(DET)曲线进行评估,结果显示与传统向量模型相比,用于事件追踪的动态模型有效地提高了系统性能,其最小的归一化追踪损耗代价降低了约9%  相似文献   

2.
事件检测是信息抽取领域的一个重要研究方向,目前的事件检测方法往往受限于数据稀疏、语料例句分布不平衡和歧义问题。该文研究发现框架语义知识库FrameNet(FN)含有丰富的已标注框架的语料,并且FN中定义的框架和事件检测中定义的事件具有极其相似的结构。框架由词法单元和一组框架元素组成,可与事件中的触发词和论元形成对应关系;而且,FN中的许多框架实际上也能表达某些事件。因此,该文利用这一相似性构建事件类型与框架类型的映射关系,从而选取FN中合适的例句作为事件检测的扩充语料,以此来优化事件检测性能。实验结果显示,针对触发词识别任务和事件类型识别任务,该文提出的框架语义辅助方法取得了较好的效果。  相似文献   

3.
基于新闻要素的新事件检测方法研究   总被引:1,自引:0,他引:1  
薛晓飞  张永奎  任晓东 《计算机应用》2008,28(11):2975-2977
新事件检测(NED)的目标是检测出报道一个新闻话题种子事件的第一个新闻。考虑到新闻的基本要素在新闻中的作用,采用特征加权的方式对传统的词频和倒排文档频率(TF-IDF)模型进行改进,并在新闻报道中提取出时间信息和地点信息,分别对内容相似度、时间相似度和地点相似度进行计算,并将三者结合来检测新事件。实验证明这种方法有效。  相似文献   

4.
目前关于话题内新事件检测的研究较少,传统的新事件检测方法多采用基于主题模型的方法,无法兼顾主题信息和语义信息,效果不够理想。针对该问题,该文提出一种基于主题词向量聚类的话题内新事件检测方法。该方法首先使用主题词嵌入(TWE)模型对经过预处理的语料进行训练,获取主题词向量;其次,通过对主题词向量进行K-means聚类来获取话题分布;再次,按照话题内新事件检测流程,将新事件检测问题转化为新子话题发现问题;最后,利用获取到的话题分布,对按时间顺序的文档进行检测。实验结果表明,该方法能够兼顾主题信息和语义信息,有效提高话题内新事件检测的性能。  相似文献   

5.
基于时空分析的线索性事件的抽取与集成系统研究   总被引:6,自引:0,他引:6  
信息抽取技术能够提供高质量的检索服务。本文面向网络新闻事件,对人们感兴趣的事件关键信息进行了抽取和集成。系统中采用了如下的方法、策略: (1) 利用句型模板构造抽取规则,然后直接从经过时间短语和空间短语识别和规范化处理的文本中抽取事件信息,从而跳过了深层句法分析,降低了实现系统的难度; (2) 利用事件的规范化的时空信息关联不同文档中的同一事件,进行事件合并; (3) 文档发生事件转移时对文档进行事件切分,从而解决了文档内不同事件信息的归并问题。初步实验结果表明:本文采用的方法和策略是有效的。  相似文献   

6.
基于事件框架的事件相关文档的智能检索研究   总被引:7,自引:2,他引:7  
在事件相关文档的检索中,事件主题的迁移和分化与相似事件的干扰是影响系统性能的两个主要因素。本文提出了一种基于事件框架知识和事件主体信息的检索方法。该方法对事件相关评价函数进行了的改进:首先,从事件语料中提炼出事件的框架知识、从事件文档中挖掘出表达事件主体的信息,然后将这些知识和信息进行向量化,最后利用向量化的结果对相关度评价函数进行优化。实验结果表明该方法是有效的,明显提高了事件相关文档的检索性能。  相似文献   

7.
微博已经成为社会新闻舆论最重要的集散地和社会群体平台,对微博信息流进行监测发现,突发事件对于舆情监控具有十分重要的意义。文章通过构建情感向量,采用改进的Kleinberg方法对情感状态进行监测,发现突发事件情感特征及突发期,并采用谱聚类方法对处于突发期的博文进行聚类分析,抽取突发事件。实验结果证明该方法可以快速发现微博流中的突发事件,是一种有效的在线事件检测方法。  相似文献   

8.
近几年来,各种类型的灾难性事件频繁发生,对人民的生活均产生了极大影响,因此,人们对灾难事件的关注程度也越来越高。以三类灾难性追踪事件作为研究对象,分析相关事件报道之间的连续性、多角度性等文本特点,采用基于规则匹配的方法对灾难性追踪事件的相关文档进行信息抽取。实验结果表明,提出的信息抽取方法具有相对较高的准确率。  相似文献   

9.
近年来,社交网络上虚假信息传播愈演愈烈,在政治、经济、心理学等方面造成了严重的社会影响.有效检测社交网络中的虚假信息并对其实施控制,是改善社交网络生态系统质量的重要手段,能为人们营造一个安全、可信的网络环境.文中首先通过调研近年来国内外社交网络虚假信息领域的代表性研究,针对虚假信息中的假新闻和谣言,梳理并给出其定义、特征及传播模型,然后介绍了目前虚假信息检测及传播控制的各种手段及方法,最后总结并分析了目前的检测及控制方法中仍存在的问题,继而进一步探讨和提出了该领域未来的研究方向.  相似文献   

10.
何天雄  李培峰  朱巧明 《计算机科学》2017,44(5):241-244, 256
事件事实性指出了事件发生与否的确定性程度,是自然语言理解的基础。在研究过程中,针对中文事件的事实性识别问题,提出了一种基于特征工程的有效识别方法。该方法选取事件的事实性相关信息进行特征的处理和转化。同时,考虑到部分特征与事件事实性之间的联系,依据规则进行特征融合。实验证明,相比基于规则的事件事实性识别方法,该方法有着更好的识别效果。  相似文献   

11.
突发事件容易引起社会舆论,是监管的重要对象。传统事件检测忽略了博文间影响力的差异。考虑到不同微博对事件的影响力不同,针对时序微博数据流,提出一种结合微博影响力与突发词的突发事件检测框架。在综合考虑用户及博文影响力的基础上,挖掘时间窗口内的重点微博,根据重点微博及历史数据计算突发词,再通过突发词检索的方式构建出具有突发性的潜在事件数据集,通过聚类算法检测突发事件。对比两种常见的事件检测方法,实验表明所提方法在准确率与效率上均有明显提升。  相似文献   

12.
An Aging Theory for Event Life-Cycle Modeling   总被引:1,自引:0,他引:1  
An event can be described by a sequence of chronological documents from several information sources that together describe a story or happening. The goal of event detection and tracking is to automatically identify events and their associated documents during their life cycles. Conventional document clustering and classification techniques cannot effectively detect and track sequential events, as they ignore the temporal relationships among documents related to an event. The life cycle of an event is analogous to living beings. With abundant nourishment (i.e., related documents for the event), the life cycle is prolonged; conversely, an event or living fades away when nourishment is exhausted. Improper tracking algorithms often unnecessarily prolong or shorten the life cycle of detected events. In this paper, we propose an aging theory to model the life cycle of sequential events, which incorporates a traditional single-pass clustering algorithm to detect and track events. Our experiment results show that the proposed method achieves a better overall performance for both long-running and short-term events than previous approaches. Moreover, we find that the aging parameters of the aging schemes are profile dependent and that using proper profile-specific aging parameters improves the detection and tracking performance further  相似文献   

13.
针对现有微博事件抽取方法由于基于事件的内容特征,而忽略事件本身的社会属性与时间特征之间的关系,进而无法识别微博热点传播过程中关键事件的问题,提出了一种融合社会影响力和时间分布的微博关键事件抽取方法。首先通过建模社会影响力来刻画微博事件的重要性,然后融合微博事件演化过程中的时间特性以捕获事件在不同时间分布下的差异,最后抽取出不同时间分布下的微博关键事件。在真实数据集上的实验结果表明,所提方法能有效抽取微博热点中的关键事件,较随机选择、词频-逆文本频率(TF-IDF)、最小权重支配集以及度与聚集系数这四种方法在事件集的完整性指标ROUGE-1上在数据集1上分别提升了21%、18%、26%以及30%,在数据集2上分别提升了14%、2%、21%以及23%,抽取效果优于传统方法。  相似文献   

14.
目的 自动检测谣言至关重要,目前已有多种谣言检测方法,但存在以下两点局限:1)只考虑文本内容,忽略了可用于判断谣言的辅助多模态信息;2)只关注时间序列模型捕捉谣言事件的时间特征,没有很好地研究事件的局部信息和全局信息。为了克服这些局限性,有效利用多模态帖子信息并联合多种编码策略构建每个新闻事件的表示,本文提出一种新颖的基于多模态多层次事件网络的社交媒体谣言检测方法。方法 通过一个多模态的帖子嵌入层,同时利用文本内容和视觉内容;将多模态的帖子嵌入向量送入多层次事件编码网络,联合使用多种编码策略,以由粗到细的方式描述事件特征。结果 在Twitter和Pheme数据集上的大量实验表明,本文提出的多模态多层次事件网络模型比现有的SVM-TS(support vector machine—time structure)、CNN(convolutional neural network)、GRU(gated recurrent unit)、CallAtRumors和MKEMN(multimodal knowledge-aware event memory network)等方法在准确率上提升了4 %以上。结论 本文提出的谣言检测模型,对每个事件的全局、时间和局部信息进行建模,提升了谣言检测的性能。  相似文献   

15.
胡文斌  彭超  梁欢乐  杜博 《软件学报》2015,26(9):2339-2355
网络演化分析与事件检测,是当前社会网络研究的热点和难点.现有的研究工作主要是针对网络提出不同的模型,并用网络特征指标对仿真结果进行评价.这些方法存在如下问题:(1) 每种方法仅针对特定网络,通用性不高;(2) 特征指标多种多样,不同模型的表现情况缺乏统一的评价标准;(3) 未考虑网络演化的时间特性,难以描述网络演化的波动性,无法检测事件.针对上述问题,提出一种基于链路预测的社会网络事件检测方法LinkEvent(由相似性计算算法SimC和事件检测算法EventD组成),它可以对不同网络的波动性进行统一评价,并依此建立事件检测模型.主要工作包括:(1) 证明了链路预测可以反映网络演化机制,相同机制下的模型演化法和链路预测在分析网络演化上具有内在的一致性;(2) 基于链路预测,提出一种网络相似性计算算法SimC(similar computing),并在考虑微观因素的基础上进行改进;(3) 利用相似性计算结果,提出一种事件检测算法EventD(event detecting)检测出新事件.在不同特征的网络上进行实验,结果表明:所提出的LinkEvent方法能够较好地解决网络演化波动性问题,实现事件检测;同时也证明了利用链路预测技术进行网络演化分析的可行性以及相似性计算和事件检测算法的有效性.  相似文献   

16.
在供水管网中部署传感器网络实时获取多个水质参数时间序列数据,当供水管网发生污染时,高效准确地检测水质异常是一个重要问题。提出多变量水质参数时间异常事件检测算法(M-TAEDA),利用BP模型分析多变量水质参数的时序数据,确定可能离群点;结合贝叶斯序贯分析独立更新每个参数的事件概率,预测单个传感器节点检测的异常概率;将单变量的事件概率融合为统一多变量事件概率,融合判断异常事件。实验结果表明:BP模型模拟多变量水质参数进行预测可以达到90%精确度;与单变量参数时间异常事件检测算法(S-TAEDA)相比,M-TAEDA可以提高异常检出率约40%,降低误报率约45%。  相似文献   

17.
一种无线传感器网络中事件区域检测的容错算法   总被引:2,自引:0,他引:2  
曹冬磊  曹建农  金蓓弘 《计算机学报》2007,30(10):1770-1776
特殊环境中的事件区域检测是无线传感器网络的一种重要应用.由于传感器的错误会导致事件区域检测的不准确,所以相关的容错算法成为近年来的研究热点.已有研究工作都仅考虑了事件的空间相关性,通过相邻传感器之间的数据交换实现容错.文中从事件的空间相关性和时间相关性入手,提出了一种以局部检测为主的分布式事件区域检测算法.该算法通过检验传感器本地采样值构成的时间序列与事件随机过程统计特征的符合程度实现容错.算法分析的结果表明,该算法可以减少传感器之间的数据交换,从而有效地利用传感器的能量.模拟实验表明,当有10%的传感器发生错误时,该算法可以检测到93%的事件区域和88%的错误传感器.  相似文献   

18.
胡文斌  王欢  严丽平  邱振宇  聂聪  杜博 《软件学报》2017,28(10):2693-2703
社会网络特征千差万别,演化规律错综复杂.合理地分析网络演化规律,及时地检测网络事件具有重大意义.基于链路预测的社会网络事件检测方法利用有限的网络拓扑信息,能够有效地发现网络演化的异常波动,准确地检测网络事件.然而,现有方法大多受到链路预测的宏观评价指标的限制,忽略了不同节点演化波动的差异,用相同的相似性计算指标去描述所有节点的演化波动,不利于提升事件检测的表现.为了进一步提升事件检测的精确性和敏感性,提出一种面向节点演化波动的社会网络事件检测方法NodeED,由节点相似性计算指标判定算法SimJudge和网络微观演化波动检测算法MicroFluc组成.主要工作如下:(1)结合粒子群优化算法,提出SimJudge定量地比较不同的相似性计算指标对节点演化波动的描述程度,确定每个节点在不同时段的最佳相似性计算指标;(2)为了量化事件对网络演化的影响,提出了MicroFluc,充分考虑节点演化波动的差异,从节点演化波动的角度对不同时段的网络整体演化波动进行定量评估;(3)在真实社会网络VAST和ENRON中进行对比实验,其结果表明,NodeED在VAST中的事件敏感性提升了100%,在ENRON中的事件敏感性提升了50%,更有利于精确地检测社会网络中发生的事件.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号