首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 62 毫秒
1.
情节规则挖掘旨在发现频繁情节之间的因果关联,已广泛应用于传感器数据处理、网络安全监控、金融证券管理、事务日志分析等众多领域.针对一个事件序列上的无冗余情节规则挖掘,提出了算法Extractor.该算法采用最小且非重叠发生的支持度定义和深度优先的搜索策略来发现频繁闭情节及其生成子,保证了频繁闭情节及其生成子的挖掘质量和挖掘效率;利用非生成子情节的Apriori性质,避免了冗余的情节生成子判断;直接由频繁闭情节及其生成子产生无冗余情节规则,提高了情节规则的生成质量和生成效率.所进行的实验证实了该情节规则抽取算法的有效性.  相似文献   

2.
丁勇  王云  李丛 《计算机系统应用》2014,23(12):202-205
事件序列上的频繁情节挖掘是时序数据挖掘领域的热点之一,基于非重叠发生的支持度定义,提出一个频繁情节挖掘算法NONEPI++,该算法首先通过情节串接产生候选情节,然后通过预剪枝和计算情节发生的时间戳来产生频繁情节.算法只需扫描事件序列一次,大大提高了情节挖掘的效率.实验证明,NONEPI++算法能有效地挖掘频繁情节.  相似文献   

3.
为克服FCMMiner算法在挖掘频繁闭情节时存在的不足,基于最小且非重叠发生的支持度定义,提出一种事件序列上频繁闭情节挖掘算法FCM++。定义两种特殊的数据结构:频繁情节树(FET)、层头表(LH),采用广度优先搜索策略进行层扩展操作,扩展时将挖掘的频繁情节逐层压缩到FET和LH结点链中。通过动态维护FET及闭合性检查过程挖掘所有的频繁闭情节。实验结果表明,FCM++算法较FCMMiner算法有更高的挖掘效率,能有效地挖掘所有的频繁闭情节。  相似文献   

4.
一种有效且无冗余的快速关联规则挖掘算法   总被引:8,自引:0,他引:8  
刘乃丽  李玉忱  马磊 《计算机应用》2005,25(6):1396-1397
关联规则的挖掘是数据挖掘的一个重要研究领域。传统算法进行关联规则挖掘时,或者生成规则的效率很低,或者生成的关联规则之间存在着大量的冗余,或者挖掘出的规则的支持度和置信度都很高,但却是无趣的、甚至是虚假的规则,且不能产生带有否定项的规则。提出了一种新的算法MVNR(MiningValidandnon RedundantAssociationRulesAlgorithm),利用频繁项集的极小子集集合很好的解决了上述问题。  相似文献   

5.
秦东霞  姚遥 《电脑学习》2012,2(1):31-34
Web日志挖掘是Web数据挖掘的一个重要研究领域。Web日志挖掘通过发现Web日志中用户的访问规律和模式,可以提取出其中潜在的规律和信息,人们对这个领域的研究也日益重视。然而,传统的基于关联规则的Web日志挖掘算法都是基于所有关联规则的。这种方式往往挖掘产生大量的候选规则,而且存在大量冗余的规则。提出了一种新的无冗余的Web日志挖掘算法,该算法通过引入频繁闭项集合最小关联规则的概念,从而解决了以往基于所有关联规则挖掘算法中出现的上述问题。  相似文献   

6.
本文研究事件序列中频繁情节的发现问题,提出了在事件序列中发现频繁串行情节的增量式算法.如果在事件序列中发现了频繁情节及其出现频率,我们就可以生成描述或预测该序列行为的情节规则.  相似文献   

7.
本文研究了事件序列中情节的发现问题,提出了在事件序列中发现频繁串行情节的增量式算法。如果在事件序列中发现了频繁情节及其出现频率,我们就可以生成描述或预测该序列行为的情节规则。  相似文献   

8.
一种基于情节矩阵和频繁情节树的情节挖掘方法   总被引:1,自引:0,他引:1  
针对现有的最小发生的频繁情节挖掘中存在的问题,提出一种发现情节的不同最小发生并对其进行计数的方法.在此基础上,提出基于情节矩阵和频繁情节树的最小发生频繁情节挖掘方法,基于直接扩展思想,只需扫描数据一次,不需生成候选情节,提高了挖掘的时空效率.提出了基于相同结点链和哈希链的优化方法,通过省略相同结点的扩展过程,进一步提高了挖掘性能.最后,在不同类型的真实数据集上进行实验,实验结果验证了所提出的频繁情节挖掘方法的优势以及优化方法的有效性和高效性.  相似文献   

9.
一种无冗余的快速关联规则发现算法   总被引:4,自引:0,他引:4  
吴伟平  林馥  贺贵明 《计算机工程》2003,29(8):90-91,108
关联规则的发现是数据挖掘的一个重要方面。传统算法不但涉及大量的数据库操作,而且生成的关联规则之间存在着大量的冗余规则。文章给出了一种无冗余的快速关联规则算法,能大量减少所需的I/O的次数,内存开销适中,并且利用规则之间的冗系关系消除了规则之间的冗余性。  相似文献   

10.
针对传统挖掘算法生成的关联规则存在大量冗余、难于理解和应用的问题,提出一种新的频繁闭项集概念格FCIL(Frequent Closed Itemsets Lattices),用于生成无冗余关联规则。首先,对概念格理论进行研究,概念格节点间的泛化和例化关系非常适合规则提取;然后,结合频繁闭项集能有效减少规则数目的特点,构建一种新的FCIL;最后,给出FCIL构造算法和相应的规则提取算法。实验表明,该方法能够高效地产生无冗余规则集。  相似文献   

11.
罗光蕊  刘杰 《计算机工程》2010,36(12):36-38
针对关联规则数量巨大并且存在极大冗余的问题,提出无冗余告警关联规则产生算法。从规则本身的关联性和等效性上定义规则的冗余性,通过构造频繁闭项集邻接图发现无冗余告警关联规则,用户可以通过发现的规则推导出其余所有冗余规则,并且得到用户所需的规则形式。该方法不仅能够减少关联规则数量,而且不会带来规则丢失。仿真结果表明,在相同的数据集、最小支持度门限和最小置信度门限条件下,无冗余关联规则数量和产生时间都小于冗余关联规则数量和产生时间,支持度门限越小,差距越显著。  相似文献   

12.
基于频繁项集挖掘最大频繁项集和频繁闭项集   总被引:3,自引:1,他引:2  
提出了基于频繁项集的最大频繁项集(BFI-DMFI)和频繁闭项集挖掘算法(BFI-DCFI)。BFI-DMFI算法通过逐个检测频繁项集在其集合中是否存在超集确定该项集是不是最大频繁项集;BFI-DCFI算法则是通过挖掘所有支持度相等的频繁项集中的最大频繁项集组合生成频繁闭项集。该类算法的提出,为关联规则的精简提供了一种新的解决方法。  相似文献   

13.
目前已提出了许多基于Apriori算法思想的频繁项目集挖掘算法,这些算法可以有效地挖掘出事务数据库中的短频繁项目集,但对于长频繁项目集的挖掘而言,其性能将明显下降.为此,提出了一种频繁闭项目集挖掘算法MFCIA,该算法可以有效地挖掘出事务数据库中所有的频繁项目集,并对其更新问题进行了研究,提出了一种相应的频繁闭项目集增量式更新算法UMFCIA,该算法将充分利用先前的挖掘结果来节省发现新的频繁闭项目集的时间开销.实验结果表明算法MFCIA是有效可行的.  相似文献   

14.
事件序列上的频繁闭情节挖掘是一个重要课题,现有的研究基于最小发生的支持度定义和广度优先的搜索策略,不可避免地导致了情节发生的“过计数”和大量候选情节的产生问题,因此,基于最小且非重叠发生的支持度定义和深度优先的搜索策略,提出了一个事件序列上的频繁闭情节挖掘算法FCEMiner,在此基础上,利用特殊前向扩展的非闭一致性避免了冗余的闭合性检查,缩小了频繁闭情节的搜索空间.理论分析和实验评估证明FCEMiner能够有效地发现事件序列上的频繁闭情节.  相似文献   

15.
由于微阵列数据集行(样本)少列(基因)多的特征,使得采用传统列枚举方法对其进行频繁闭合模式挖掘较为困难.基于行枚举方法,提出超链接结构HT-struct,并基于该结构提出频繁闭合模式挖掘新算法HTCLOSE.算法采用深度优先搜索策略,结合高效的修剪技术和巧妙的链表组织技术,在时间和空间上均得到了优化.实验表明,HTCLOSE算法通常快于行枚举算法CARPENTER.  相似文献   

16.
沙俐敏  杨淑珍 《计算机工程与设计》2006,27(11):2041-2043,2048
回顾了常见的关联规则算法,关注频繁闭项集这一非常有发展前途的方法.在综合Tough型约束与频繁闭项集的基础上,提出了关联规则的一种新算法--基于Tough型约束的频繁闭项集挖掘算法(TC-based FCIM Algorithm),分析了算法中选择过程和过滤过程这两个重要过程的先后顺序.  相似文献   

17.
伪装攻击就是未授权用户通过伪装成合法用户来获得访问关键数据或更高层访问的权限。长久以来,检测伪装攻击在保障系统的网络安全中发挥着巨大的作用。首先讨论了一个用于评价伪装攻击检测算法有效性的方程,而后描述了频繁情节算法在检测伪装攻击中的应用,最后,采用SEA数据集对该算法进行了评估。结果证明频繁情节算法在检测伪装攻击时是行之有效的。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号