首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 171 毫秒
1.
赵旭剑  王崇伟 《计算机应用》2021,41(11):3139-3144
微博作为人们获取和传播新闻事件的主要平台,隐藏着丰富的事件信息。从微博数据中抽取故事线能为用户提供一种直观的方式来准确理解事件演化,然而微博数据稀疏和上下文缺乏的特点为故事线抽取带来了挑战。因此,通过两个连续的任务从微博数据中自动抽取故事线:1)基于微博传播影响力对事件进行建模,并提取出首要事件;2)基于事件特征建立异构事件图,提出事件图卷积网络(E-GCN)模型来提升对事件间隐式关系的学习能力,从而实现事件的故事分支预测并链接事件。在真实数据集上从故事分支和故事线两个角度进行评测,结果表明所提方法在故事分支生成测评中,相较于贝叶斯模型、斯坦纳树和故事森林在F1值上,在Dataset1上分别高出28个百分点、20个百分点和27个百分点,在Dataset2上分别高出19个百分点、12个百分点和22个百分点;而在故事线抽取评测中,相较于故事时间线、斯坦纳树和故事森林在正确的边准确率上,在Dataset1上分别高出33个百分点、23个百分点和17个百分点,在Dataset2上分别高出12个百分点、3个百分点和9个百分点。  相似文献   

2.
徐勇 《计算机工程与科学》2015,37(12):2256-2261
基于价值累加理论分析网络热点事件的演变过程,确定触发因素的出现、共同信念的形成、行动动员的完成是事件演变的三个关键环节,设计监测模型,对事件舆情中的敏感因素、情感的形成及扩散进行分析判断。在此基础上,构造网络舆情热点信息智能监测平台系统(NPOIMS),以我国西部地区的x市为实例对象,架构舆情监测系统,监测与x市有关的各类舆情信息,提炼热点词语,进行舆情研判,提供分析报告,为相关部门提供舆情引导和事件应对的信息参考和决策支持。  相似文献   

3.
基于情感分布的微博热点事件发现   总被引:2,自引:0,他引:2  
微博(Micro-Blog,Twitter)是互联网上的一种重要媒体,以简短、便捷的方式表达用户的观点,并实现多发布工具即时分享,已经成为热点事件产生和传播的重要场所,因此微博平台中热点事件发现等方面研究的重要性便突显出来了。该文依据热点事件的出现会使用户所发微博中情感词数量增多,情感发生变化,提出了情感分布语言模型,通过分析相邻时段间情感分布语言模型间的差异,实现对热点事件的发现。实验结果表明该文方法可以有效地从微博平台中发现热点事件,并且有助于对微博平台中热点事件的管理和监控。  相似文献   

4.
提出一种新的热点轨迹聚类算法(LSHT),结合社交网络中的位置属性和社交特征,利用基于位置的社交网络(LBSN)用户中的好友关系特征,引入用户亲密度和用户活跃度,对用户之间的联系进行分析;提出对用户轨迹进行评分的评分函数,计算用户轨迹的影响力。结合用户亲密度和轨迹评分值,挖掘用户好友中的热点轨迹。该算法能够将热门轨迹中的不真实轨迹进行过滤。实验表明,该算法能更快更准确地挖掘出用户好友中的热点轨迹。  相似文献   

5.
推特和新浪微博等社交网络已成为报道公共事件的重要平台,它们为监控事件及其演化提供了宝贵的数据.然而,这些数据包含的非正式词语和碎片化文本使得从中提取描述性的信息具有一定的挑战.另外,从快速生成的大量微博监控事件演化也有一定难度.提出在社交网络中监控事件并对具有相同主题的事件演化进行分析.这既可以在粗粒度水平获得事件的概述,又可以在细粒度水平获得事件的详细信息.通过3个连续的组件实现该任务.1)用结构化的方法从微博检测事件;2)基于事件的隐式语义信息对事件聚类并将聚类获得的簇定义为故事;3)用基于图的方法为每个故事生成故事脉络,故事脉络用包含摘要的有向无环图表示故事内事件的演化.用户体验评估实验表明:提出的方法比现有方法具有更高的准确性和可理解性,并能够帮助用户监控事件及其演化.  相似文献   

6.
互联网时代,纷繁复杂的Web信息使得人们难以快速、准确地获得新闻事件的故事脉络。因此,如何从Web信息中自动挖掘社会事件的故事脉络(简称“故事脉络挖掘”)成为近年来Web数据挖掘领域的一个研究热点。故事脉络挖掘旨在通过分析新闻事件与后续关联事件间的相互关系,抽取事件的演化阶段,并进一步挖掘事件的演化模式。故事脉络挖掘可应用于网络新闻检索、文本摘要、舆情监测等众多应用场景,具有重要的研究价值。该文首先概述了故事脉络挖掘的定义、流程及主要任务,然后从故事脉络构建和事件演化分析两个方面详细介绍了目前故事脉络挖掘方向的主要进展,接着比较了两类数据集及其评测标准,最后给出了故事脉络挖掘领域未来的若干研究挑战和技术框架。  相似文献   

7.
从微博中准确高效地挖掘出正在发生的热点事件是近年来研究的热点。通过综合考虑微博用户的粉丝数量和微博本身的转发、评论次数计算每条微博的影响力,从而提出一种基于影响力的微博新兴热点事件检测方法 IEED(Influence-Based Emerging Hotspot Event Detection)。该方法运用层次聚类将微博帖子聚类为事件集,并提取出事件中的关键词构成事件摘要。通过运用现实生活中的新浪微博数据作为实验数据集来测试所提出的方法,实验结果证明,基于影响力的微博新兴热点事件检测方法(IEED)能在早期高效地检测出微博中的新兴热点事件,具备一定的应用价值。  相似文献   

8.
肖锐  刘明义  涂志莹  王忠杰 《计算机应用》2022,42(11):3513-3519
用户的社交媒体中蕴含着他们过去的个人经历和潜在的生活规律,研究其规律对预测用户未来的行为以及对用户进行个性化推荐有很大的价值。通过收集微博数据,定义了11种类型的事件,并提出了一个三阶段的Pipeline的系统,利用BERT预训练模型,分别在三个阶段使用BERT+BiLSTM+Attention、BERT+FullConnect、BERT+BiLSTM+CRF方法进行个人事件检测。从微博文本中抽取出该文本是否包含定义的事件、包含的事件类型、每种事件包含的元素等信息,具体元素为Subject(事件主语)、Object(事件元素)、Time(事件发生时间)、Place(事件发生的地点)和Tense(事件发生的时态),从而探究用户个人时间轴上的事件变化规律来预测个人事件。在收集的真实用户微博数据集上进行实验,并与逻辑回归、朴素贝叶斯、随机森林、决策树等分类算法进行对比分析。实验结果表明,三个阶段中的BERT+BiLSTM+Attention、BERT+FullConnect和BERT+BiLSTM+CRF方法均取得了最高的F1值,验证了所提方法的有效性。最后根据所提方法抽取出的事件和其中的时间信息可视化地构建了用户的个人事件时间轴。  相似文献   

9.
一种基于动态进化模型的事件探测和追踪算法   总被引:18,自引:2,他引:16  
在大量分析网络新闻特点的基础上,借鉴Single-Pass聚类思想,并结合新闻要素给出了一种基于动态进化模型的事件探测和追踪算法.该动态模型是基于新闻事件的生存特点提出的,包括:基于时间距离的相似度计算模型、事件模板进化策略以及动态阈值设置思想.该算法可以自动对新闻资料进行组织生成新闻专题,进而为用户提供个性化服务.实验结果验证了算法的有效性.  相似文献   

10.
近几年,在基于事件的社交网络(EBSNs)服务中,为便于增强用户体验,事件推荐任务一直被广泛研究。本文基于对EBSN中用户行为数据的详细分析,提出了一种新型的融合多种数据特征的潜在因子模型。该模型综合考虑EBSN中两种新型的数据特征: 异构的社交关系特征(线上社交关系+线下社交关系)和用户参与行为的地域性特征。基于真实的Meetup数据集,实验结果表明我们的算法在解决事件推荐问题时比传统的算法有更好的性能。
  相似文献   

11.
针对中文新闻事件的语义层次自动理解问题,给出了新闻事件的定义,构造了一种基于本体的新闻事件模型NOEM。NOEM利用事件的类型、时间、空间、结构、因果、媒体六个方面特征描述新闻事件的5W1H(Who,What,Whom,When,WhereandHow)语义要素。将抽取的关键事件语义要素自动扩充到本体中后,可构成事件知识库支持事件语义层次的应用。与现有事件模型的比较以及实际应用结果显示,NOEM能够有效描述单个新闻文档中的关键事件、语义要素以及它们之间的关联,具有很强的形式化知识表达、应用集成和扩展能力。  相似文献   

12.
现有汉越跨语言新闻事件检索方法较少使用新闻领域内的事件实体知识,在候选文档中存在多个事件的情况下,与查询句无关的事件会干扰查询句与候选文档间的匹配精度,影响检索性能。提出一种融入事件实体知识的汉越跨语言新闻事件检索模型。通过查询翻译方法将汉语事件查询句翻译为越南语事件查询句,把跨语言新闻事件检索问题转化为单语新闻事件检索问题。考虑到查询句中只有单个事件,候选文档中多个事件共存会影响查询句和文档的精准匹配,利用事件触发词划分候选文档事件范围,减小文档中与查询无关事件的干扰。在此基础上,利用知识图谱和事件触发词得到事件实体丰富的知识表示,通过查询句与文档事件范围间的交互,提取到事件实体知识表示与词以及事件实体知识表示之间的排序特征。在汉越双语新闻数据集上的实验结果表明,与BM25、Conv-KNRM、ATER等基线模型相比,该模型能够取得较好的跨语言新闻事件检索效果,NDCG和MAP指标最高可提升0.712 2和0.587 2。  相似文献   

13.
将互联网上的新闻事件按照时间顺序和事件依赖关系组织起来呈现给用户,可以帮助用户方便快捷地了解新闻事件演进过程.定义了Web新闻流增量演进任务(IEA)来实现这一需求.与一些类似的工作比较,IEA具有以下特点:适合Web新闻事件的流特征,以图的方式在时间线上增量更新新闻话题的事件演化过程.为了完成IEA任务,定义了一个事件进展图(EEG)数据结构,并相应地提出了EEG构造和整理算法.实验证明,该方法可以有效地实现新闻事件时间线分析的任务.  相似文献   

14.
Massive amounts of information about news events are published on the Internet every day in online newspapers, blogs, and social network messages. While search engines like Google help retrieve information using keywords, the large volumes of unstructured search results returned by search engines make it hard to track the evolution of an event. A story chain is composed of a set of news articles that reveal hidden relationships among different events. Traditional keyword-based search engines provide limited support for finding story chains. In this paper, we propose a random walk based algorithm to find story chains. When breaking news happens, many media outlets report the same event. We have two pruning mechanisms in the algorithm to automatically exclude redundant articles from the story chain and to ensure efficiency of the algorithm. We further explore how named entities and word relevance can help find relevant news articles and improve algorithm efficiency by creating a co-clustering based correlation graph. Experimental results show that our proposed algorithm can generate coherent story chains without redundancy. The efficiency of the algorithm is significantly improved on the correlation graph.  相似文献   

15.
Users of the internet often wish to follow certain news events, and the interests of these users often overlap. General search engines (GSEs) cannot be used to achieve this task due to incomplete coverage and lack of freshness. Instead, a broker is used to regularly query the built-in search engines (BSEs) of news and social media sites. Each user defines an event profile consisting of a set of query rules called event rules (ERs). To ensure that queries match the semantics of BSEs, ERs are transformed into a disjunctive normal form, and separated into conjunctive clauses (atomic event rules, AERs). It is slow to process all AERs on BSEs, and can violate query submission rate limits. Accordingly, the set of AERs is reduced to eliminate AERs that are duplicates, or logically contained by other AERs. Five types of event are selected for experimental comparison and analysis, including natural disasters, accident disasters, public health events, social security events, and negative events of public servants. Using 12 BSEs, 85 ERs for five types of events are defined by five users. Experimental comparison is conducted on three aspects: event rule reduction ratio, number of collected events, and that of related events. Experimental results in this paper show that event rule reduction effectively enhances the efficiency of crawling.  相似文献   

16.
借助新闻事件元素之间的关联特性,提出了基于事件元素无向图的查询扩展方法,利用新闻事件元素之间的关联关系进行查询扩展提升新闻事件检索效果。首先分析候选事件文档与查询项的关系,确定待扩展的元素;然后利用事件元素之间的关联关系构建无向图,通过事件向量空间计算边的权重;最后,利用无向图节点权重模型计算事件元素权重,依据权重进行事件元素扩展。在新闻事件查询扩展方面进行了对比试验,结果表明该文提出的查询扩展方法取得了较好的效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号