共查询到20条相似文献,搜索用时 15 毫秒
1.
新闻事件检测是自然语言处理任务中的一项任务.新闻事件检测旨在从新闻文本数据流中检测出新闻事件并给出事件主题.人工构建新闻事件的特征费时费力.传统的新闻事件检测方法是根据新闻事件之间的空间距离检测新闻事件,对于不同的新闻事件相似度较高时,容易误判为同一事件.针对上述问题,论文提出基于注意力机制的双向长短记忆网络构建新闻事... 相似文献
2.
一种基于动态进化模型的事件探测和追踪算法 总被引:16,自引:2,他引:16
在大量分析网络新闻特点的基础上,借鉴Single-Pass聚类思想,并结合新闻要素给出了一种基于动态进化模型的事件探测和追踪算法.该动态模型是基于新闻事件的生存特点提出的,包括:基于时间距离的相似度计算模型、事件模板进化策略以及动态阈值设置思想.该算法可以自动对新闻资料进行组织生成新闻专题,进而为用户提供个性化服务.实验结果验证了算法的有效性. 相似文献
3.
为获得更好的事件发现和代表性新闻抽取性能,引入数据集代表点采样聚类的视角,研究实现了一种事件发现及表示的集成分析方法。对于给定的新闻流数据,首先引入信息支撑度定义新闻间关系权重和事件关系权重,并通过引入双层近邻传播算法的迭代构建整体时间流上的单向事件内容支撑度网络,实现代表性新闻的分层增量采样,进一步考虑以最大相似度划分策略实现代表性新闻上的整体新闻流数据聚类。实验结果表明,相比于现有相关方法,新方法在大规模新闻流数据上具有显著的计算效率,可提取出新闻流中极有代表性的新闻,以及获得更好的新闻文档聚类质量,其热点事件发现结果与权威机构评选的重大新闻有极高吻合度。 相似文献
4.
5.
随着“一带一路”国家战略实施,我国与越南的交流与合作日益密切,及时掌握两国新闻事件动态意义重大。该文针对汉越双语新闻事件关联分析所面临的跨语言关联问题,研究汉越双语新闻事件关联分析方法。汉越双语新闻事件分析其实质是多语言多文本的理解问题。其主要难点是要解决多语言多文本下的新闻事件理解问题。该文提出了基于因子图模型的局部密切度传播算法。首先使用双语主题概率模型,从双语文档中获得双语主题及主题概率分布,然后基于新闻事件的文本相似度构建事件因子图模型,在因子图上对相互关联的事件使用局部密切度传播算法计算某一主题下所有相互关联的事件间的影响力。最后得到不同主题下事件间的影响力拓扑图。实验结果表明该方法相比相似度计算和词语共现的方法取得了不错效果。 相似文献
6.
提出了一种基于新闻视频中的标题字幕信息和音视频特征对新闻事件进行分割的方法,并实现了一个新闻事件分割、浏览和检索的原型系统。提出的方法综合利用新闻视频中的标题检测、主持人画面检测以及静音片段和语者切换检测技术分割整段新闻中的新闻事件。实验结果表明,该方法较仅利用标题的新闻事件分割方法在分割准确性上有了显著提高。 相似文献
7.
对于新闻报道,如何做好采访是基础,也是十分必要的前提条件,民生新闻更是如此。都说巧妇难为无米之炊,只有有了成功的采访,积累了大量的感性材料,才能写出有价值的新闻,所描绘的新闻人物和新闻事件才会有血有肉、鲜活动人,因此,决定一篇新闻采访的质量的最重要因素就是写稿前开展的采访活动是否成功。本文拟就民生新闻的采访问题谈几点认识。 相似文献
8.
越南与中国一水相依,是重要的政治、军事和经济合作邻国,然而针对越南语新闻事件元素的提取研究非常匮乏。本文针对越南语特点,提出一种基于最大熵模型的越南语新闻事件元素抽取方法。该方法针对越语句子结构和词汇语义的特点,采用最大熵算法,选取上下文、邻近触发词以及邻近实体作为特征,定义特征模版,训练获得越南语新闻事件模型,实现新闻事件元素抽取。抽取实验结果表明本文提出的方法抽取新闻事件元素的准确率达到80%以上。 相似文献
9.
10.
舆情新闻事件跟踪,是舆情监控、热点分析、政策制定等研究和应用的重要基础。针对舆情新闻的稀疏性、敏感性、易演化性、次生性等特点,基于在线Biterm主题模型(online Biterm topic model,DBTM),通过随机坍缩变分贝叶斯(stochastic collapsed variational Bayesian inference,SCVB0)算法更新参数,提出面向舆情新闻事件监控的主题模型MBTM(monitor Biterm topic model),利用该模型检测初期事件主题,跟踪后续新闻所属的主题。为了对存在关联关系的事件进行串联,进一步给出事件线索的概念,分别从主题层面和语义层面度量线索关联度,进而针对新闻事件主题生成事件线索。实验结果表明,MBTM模型在大多数指标上均优于OBTM等模型,验证了该方法的有效性和高效性。 相似文献
11.
近年来,新闻舆论监督一直是我国社会各界关注和思考的热点。从"南丹矿难事件"到"孙志刚事件""、佘祥林案件"等等,无不显示出了新闻舆论的巨大导向性。其影响范围之大,公众参与度之高,是令人瞠目的。新闻舆论监督在某种程度上可推动民主法治的进程,与法律这种硬控制手段相比,新闻舆论监督比法律监督具有更大的灵活性,监督更为迅速,具有更大的公开性。 相似文献
12.
触发词的识别在事件检测任务中起着至关重要的作用。目前没有越南语触发词标记语料,而中文触发词标记语料较为丰富,根据表达相同观点但语言不同的句子通常有相同或相似的语义成分这一特征,该文提出一种基于中文触发词指导的越南语新闻事件检测方法。首先采用对抗学习的方法将两种语言映射到同一语义空间下,然后将映射后的中文触发词嵌入指导模型识别越南语新闻中的触发词信息,最后进行事件类型的分类。通过在越南语新闻事件检测的实验结果表明,在中文触发词指导下的越南语新闻事件检测取得了较好的效果。 相似文献
13.
14.
基于关键词元的话题内事件检测 总被引:1,自引:0,他引:1
各种媒体每天有大量的新闻报道产生,需要一种自动化的分析方法将新闻以一种更加清晰的组织形式展示给用户.大多已有工作将新闻划分成平面的话题,然而一个话题并非仅仅是简单的新闻集合,而是由一系列相互关联的事件所组成的.由于话题内的事件之间往往非常相似,导致话题内的事件检测精确度较差.为了克服以上问题,提出了基于事件词元委员会的事件检测与关系发现方法.即首先挖掘每个事件的核心词元,随后利用事件的核心词元进行事件检测与关系发现.在Linguistic Data Consortium(LDC)的两个数据集上的实验结果显示,提出的事件检测与关系发现方法可以显著地改善已有方法的效果. 相似文献
15.
16.
正新闻评论是媒体编辑部或作者对新近发生的有价值的新闻事件和有普遍意义的紧迫问题,运用分析和综合的方法,就事论理,就实论虚,有着鲜明针对性和指导性的一种新闻文体。新闻评论的作用一般体现在以下几个方面。一是引导的作用,运用马克思主义的立场、观点、方法,对现实生活中的新闻事实和重要问题作出分析,可以旗帜鲜明地表彰先进,针砭时弊,帮助群众明辨是非,区分先进和落后、正确和错误;为群众解疑释惑;使人们正确认识当前的形势,指明方向;二是 相似文献
17.
张静 《计算机光盘软件与应用》2010,(6):23-23
随着互联网的大规模普及,造成了大量的文本数据累积,其中很大一部分是短文本数据。如何从海量信息中发现突发事件的新闻流主题,并跟踪突发事件的相关信息,文本挖掘技术就显得尤为重要了。本文介绍了文本挖掘在新闻文本挖掘中的应用,分析了新闻事件挖掘的研究现状。 相似文献
18.
张松波 《数码设计:surface》2014,(1):76-77
随着科技和传播媒体的多样性发展,影视新闻的受众人群在不断增长,新闻从当初的报纸,刊物,更多地向电视,网路方面拓展。而有一些新闻报道因为新闻采访者无法立即到达现场拍摄影视资料,但又需要通过一些画面使观众更好地了解新闻事件的发展状况,所以运用动画手段重现虚拟现实在新闻传播中具有很重要的作用。 相似文献
19.
20.
针对汉越双语新闻事件线索分析,提出了基于全局/局部共现词对分布的汉越双语事件线索生成方法。该方法首先将新闻话题词语分布作为全局词语表征全局事件,然后用一定时间粒度下新闻片段特有的时间、人物、地点等事件元素作为局部词语,分析新闻片段中全局词语和局部词语的共现关系,将全局/局部词语的共现规律作为监督信息,结合RCRP算法和汉越双语新闻的对齐语料,构建有监督话题生成主题模型,获得相应时间跨度下代表事件发展进程的子话题分布,通过子话题的分布反映事件发展的线索,从而构建出在线汉越双语事件线索生成模型。实验在汉越混合新闻数据集上进行,事件线索生成对比实验结果证明了提出的方法的有效性。
相似文献
相似文献