首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 62 毫秒
1.
吕楠  罗军勇  刘尧  杨慧洁 《计算机工程》2009,35(23):71-72,7
在话题追踪研究领域,话题随着时间不断发展变化。目前的话题追踪方法无法对话题的发展演化进行全局的把握。针对该问题,提出基于相似度计算的话题演化分析方法。该方法采用时间片划分的思想,通过子话题间的相似度计算得到话题演化的具体过程及细节。实验结果表明,该方法能有效地反映话题的演化历程。  相似文献   

2.
针对传统基于内容相似度的事件关系计算方法不能分析出事件间的潜在关系的问题,提出了基于FCA的事件关系计算方法。该方法利用根据话题的三层结构模型,对话题中的事件进行属性提取,并依据特征频率因子进行属性选择。利用两个事件之间的属性关系建立形式背景,以此为基础形成概念格。用基于概念格的相似度分析发现事件之间潜在。实验证明了这种方法的有效性。  相似文献   

3.
胡学刚  吴勇 《计算机工程》2009,35(23):212-213,
在话题追踪研究领域,话题随着时间不断发展变化。目前的话题追踪方法无法对话题的发展演化进行全局的把握。针对该问题,提出基于相似度计算的话题演化分析方法。该方法采用时间片划分的思想,通过子话题间的相似度计算得到话题演化的具体过程及细节。实验结果表明,该方法能有效地反映话题的演化历程。  相似文献   

4.
多标记事件预测是指预测多个相关联的事件是否会在未来发生,相比传统单标记事件预测,需要同时预测多个目标事件。现有的事件预测研究忽略各领域存在的多标记事件情境,且对多标记事件预测研究较少。提出一种基于事件演化图的多标记事件预测模型(MLEP),以实现基于事件演化图(EEG)的多标记事件预测研究模式。首先基于事件链构建事件演化图;然后对多标记事件预测问题进行问题转换,将多标记问题转化为单标记问题,利用事件表示学习方法获取所有事件的向量表示,对多标记事件进行编码;最后采用门控图神经网络(GGNN)框架构建多标记事件预测模型,根据相似度匹配出最优的后续事件,实现多标记事件的预测。在真实数据集上的实验结果表明,MLEP模型可以有效地预测出多标记事件,预测准确率达到了65.58%,性能优于大多现有的基准模型,提升幅度达到了4.94%以上。通过消融实验也证明了更好的事件表示学习方法对事件具有较好的表示效果,提升多标记事件预测的性能。  相似文献   

5.
事件发展的持续性和相互影响性使人们对事件的后续进展越来越感兴趣,而传统的事件分析大多是针对基于句子的事件.针对专题事件,结合single-pass聚类方法、兼类思想以及动态增量思想,提出了一种增量式子主题动态演化分析模型.该模型基于专题事件的时序特征提出,包括动态阈值的设定、相似度平滑、子主题动态增量策略等过程,以及运用χ\\+2统计的思想来综合评价模型性能的方法.该模型可以有效地对专题事件进行子主题分析,进而使人们能够更直接和快速地了解主题事件的进展.实验结果表明提出的方法使子主题演化分析的性能有了显著的提高.  相似文献   

6.
一种基于反例样本修剪支持向量机的事件追踪算法   总被引:1,自引:0,他引:1  
支持向量机(SVM)在各类别样本数目分布不均匀时,样本数量越多其分类误差越小,而样本数量越少其分类误差越大.在分析这种倾向产生原因的基础上,提出了一种基于反例样本修剪支持向量机(NEP—SVM)的事件追踪算法.该算法首先修剪反例样本,根据距离和类标决定一反例样本的取舍,然后使用SVM对新的样本集进行训练以得到分类器,补偿了上述倾向性问题造成的不利影响.另外,由于后验概率对于提高事件追踪的性能至关重要,而传统的支持向量机不提供后验概率,本文通过一个sigmoid函数的参数训练将SVM的输出结果映射成概率.实验结果表明NEP—SVM是有效的.  相似文献   

7.
演化算法是求解多目标优化问题(MOP)重要而有效的方法,而应用演化策略、技巧是改善解性能的重要途径。论文叙述了多目标优化问题的有关概念,结合已有算法中的方法,设计了基于两种交叉操作相互结合的多目标演化算法(MOEAHC),该算法不仅具有较高的计算效率,而且能够保持解的多样性分布。测试结果表明该算法的良好性能。  相似文献   

8.
一种高效的多目标演化算法   总被引:1,自引:1,他引:0       下载免费PDF全文
为了提高非劣解向Pareto最优前沿收敛的速度及进一步提高解的精度,在设计了一种新的杂交算子并改进了NSGA-Ⅱ的拥挤操作的基础上,提出了一种基于分级策略的多目标演化算法。数值实验表明,新算法能够非常高效地处理高维的最优前沿为凸的、非凸的和不连续前沿的多目标测试函数,得到的非劣解具有很好的分布性质。但在处理高维的具有太多局部最优前沿的多峰函数时极易陷入局部最优前沿。  相似文献   

9.
一种基于动态进化模型的事件探测和追踪算法   总被引:18,自引:2,他引:16  
在大量分析网络新闻特点的基础上,借鉴Single-Pass聚类思想,并结合新闻要素给出了一种基于动态进化模型的事件探测和追踪算法.该动态模型是基于新闻事件的生存特点提出的,包括:基于时间距离的相似度计算模型、事件模板进化策略以及动态阈值设置思想.该算法可以自动对新闻资料进行组织生成新闻专题,进而为用户提供个性化服务.实验结果验证了算法的有效性.  相似文献   

10.
在话题检测和追踪过程中,话题漂移的产生往往降低话题检测和追踪的准确率.为了克服这个问题,通过分析新闻报道中种子事件与后续的新颖事件之间的演化关系,强调命名实体词的贡献度,并及时调整话题的重心向量,建立了一种动态的话题检测和追踪模型.实验证明,该模型有效地降低了话题漂移现象在话题检测与话题追踪中的影响.  相似文献   

11.
基于子话题分治匹配的新事件检测   总被引:4,自引:0,他引:4  
洪宇  张宇  范基礼  刘挺  李生 《计算机学报》2008,31(4):687-695
新事件检测是话题检测与跟踪领域的一项重要研究,其任务是实时监控新闻报道流并从中识别新话题.现有方法将话题和报道描述为单一结构的特征向量进行匹配,造成子话题间互为噪声并形成错误语义,从而误导新话题的识别.针对这一缺陷,文中提出基于子话题分治匹配的新事件检测方法,将话题和报道划分为不同子话题,根据相关子话题的比例关系和分布关系建立新话题识别模型.实验在TDT4和TDT5中获得显著改进,最小检测错误代价为0.4061,相应漏检率为0.1859.  相似文献   

12.
子话题是对话题的再次划分,是比话题粒度更细的新兴研究方向,子话题的聚类是话题内部演化关系分析的基础。提出了融合内容特征和时间特征的中文新闻子话题聚类方法,重点分析了子话题内容特征的表现规律,研究了子话题特征词的权重计算和降维方法。选取5个话题的18个子话题进行了实验,结果表明,所提方法的性能与已有的子话题聚类方法相比有显著提高。  相似文献   

13.
基于事件框架的主题事件融合研究*   总被引:1,自引:0,他引:1  
针对事件抽取获得的单个元事件无法完整描述主题事件的特点,提出了一种主题事件的融合方法,通过该方法将与同一主题相关的所有元事件整合在一起,以层次化的形式表示。首先定义了一种事件融合框架TEFF(topic event fusion framework)。该框架根据各类元事件在主题事件中的作用,将主题事件以层次化的形式表示。同时给出元事件和主题的相关度计算方法,通过该算法来评价元事件和主题的相关度。在TEFF的指导下,通过相关度计算,实现主题事件的融合。在以2008年起的金融危机为主题的实验中,取得了F值为7  相似文献   

14.
基于SVM的中文报道关系识别方法研究   总被引:1,自引:0,他引:1       下载免费PDF全文
针对网络新闻的特点,从人名、时间名、地点名、组织机构名、内容五个方面抽取特征词形成特征向量。在此基础上,分别进行了相似度计算,其中,人名、组织机构名、内容采用余弦夹角的方法,时间和地点向量,相似度计算采用了引入报道时间和关联度计算。最后,使用这5个相似度作为特征,使用SVM进行训练,并在测试集上进行了测试。测试结果表明,这种方法可以有效地改善系统的性能。  相似文献   

15.
徐建民  孙晓磊  吴树芳 《计算机应用》2013,33(10):2807-2810
针对互联网新闻事件追踪,结合时间信息提出了一种用于事件追踪的动态模型。该模型将时间因素加入到传统向量模型中,在此基础上得到文档与事件包含的相同特征词之间的时间相似度,并将其应用于文档与事件的相关性计算。若文档与事件相关,则把文档中新的特征词加入事件特征词集并重新调整事件特征词集中特征词的权重和时间信息。实验采用检测错误权衡(DET)曲线进行评估,结果显示与传统向量模型相比,用于事件追踪的动态模型有效地提高了系统性能,其最小的归一化追踪损耗代价降低了约9%  相似文献   

16.
基于时间序列演变分析的有效相似性定义和聚类   总被引:1,自引:0,他引:1       下载免费PDF全文
时间序列广泛存在于商业应用中,比如电力负荷序列、网络日志等。挖掘时间序列数据对决策分析非常重要,特别地,决定时间序列的相似性在各种实际问题中起关键的作用,比如分析各个区域的电力需求特征。以前的相似性度量方法从未使用过演变这种特性去度量时间序列的相似性,基于演变分析提出了有效的时间序列相似性度量方法(SEA),该方法通过量化演变趋势构建了有效的相似性定义,并且提出了基于该方法的聚类策略。通过在实际数据集上和其它方法的实验比较,证明了提出方法的有效性,因此也证明了时间序列演变分析对相似性度量的重要意义。  相似文献   

17.
针对现有的复杂事件匹配处理方法存在的匹配代价高的问题,提出了一种利用事件缓冲区(有序事件列表)进行递归遍历的复杂事件匹配算法ReCEP。不同于现有方法利用自动机在事件流上进行匹配,该算法将复杂事件查询模式中的约束条件分解为不同类型,再在有序列表上对不同约束分别进行递归校验。首先,根据查询模式将相关事件实例按照事件类型进行缓存;其次,在有序列表上对事件实例执行查询过滤操作,并给出了一种基于递归遍历的算法来确定初始事件实例并且获取候选序列;最后,对候选序列的属性约束进行进一步的校验。基于股票交易模拟数据进行的实验测试和分析的结果表明,与当前主流的匹配方法 SASE和Siddhi相比,ReCEP算法能够有效地减少查询匹配的处理时间,总体性能上均更优,查询匹配效率提升了8.64%以上。可见,所提出的复杂事件匹配方法能够有效提高复杂事件匹配的效率。  相似文献   

18.
重点研究事件检测模型中层次聚类算法的改进,提出利用在关键词抽取基础上利用新闻的各种要素信息计算新闻之间相似度的方式,搭建了一个在线新闻检索系统,在其上利用新华社的新闻语料进行实验。实验结果表明改进方法的效果明显,性能较之未使用前有显著的提升。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号