首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
以前基于支持度一置信度框架的关联规则挖掘算法都是先用支持度做为阈值对搜索结果进行剪枝 ,产生频繁集 ,再针对频繁集产生关联规则 ,这就是频繁关联规则。然而在很多应用中 ,诸如 :鉴别相似的Web文件、网络中入侵检测等 ,有许多有趣的关联规则仅有很少的支持度。在本文中 ,针对这种情况 ,提出了一种可以挖掘非频繁项之间有趣规则的算法 ,此算法先用相似度作为兴趣度度量对算法结果进行剪枝  相似文献   

2.
一种多重最小支持度关联规则挖掘算法   总被引:5,自引:0,他引:5  
针对单一最小支持度挖掘关联规则不能反应不同数据项出现频度与性质的问题,提出了一个基于频繁模式树的多重支持度关联规则挖掘算法MSDMFIA(Multiple minimum Supports for Discover Maximum Fre-quent Item sets Algorithm),根据不同数据项的特点定义多重支持度,通过挖掘数据库中的最大频繁项目集,计算最大频繁候选项目集在数据库中的支持度来发现关联规则.该算法可以解决关联规则挖掘中经常出现的稀少数据项问题,并解决了传统的关联规则挖掘算法中的生成频繁候选集和多次扫描数据库的性能瓶颈.实验结果表明,本文提出的算法在功能和性能方面均优于已有算法.  相似文献   

3.
发现最大频繁项目集是关联规则挖掘的重要步骤,针对关联规则挖掘中最小支持度发生变化的增量式更新问题,提出了高效发现最大频繁项目集的更新算法.该算法在FP树的基础上增加了记录各项目支持数的表,在头表中增加了域,从而减少了访问事务数据库和FP树的时间,提高了发现最大频繁项目集的效率.  相似文献   

4.
基于集体度-置信度的关联规则挖掘   总被引:2,自引:0,他引:2  
总结并研究了基于集体度-置信度的关联规则挖掘算法,用集体度代替支持度对搜索空间进行压缩,成功地解决了传统的频繁关联规则挖掘存在的属性集产生上的欺骗性及处理稠密数据集方面的缺陷.  相似文献   

5.
针对已有的对低支持度关联规则进行挖掘的算法中没有提出对具有多个相关项的关联规则进行挖掘的有效方法,本文提出一种能够对低支持度关联规则的多个相关项进行有效挖掘的方法。算法基于相似度来衡量各个相关项的关联程度,在已有算法的基础上增加了一次特殊的矩阵转换,从而将对项的相似度衡量方法进行了转换,转换后的矩阵可以基于Apriori性质来拓展多个相似相关项。算法在低支持度情况下具有较高的挖掘效率和良好的挖掘效果,算法还可以用来挖掘多个项之间的排斥规则。  相似文献   

6.
一个改进项目的加权关联规则挖掘算法   总被引:1,自引:0,他引:1  
提出了一个改进的项目加权关联规则挖掘算法.该算法利用一个加权频繁项目集必须满足的加权支持度下界,对加权频繁候选项目集进行剪枝,该下界计算简便,可以减少挖掘的计算量.理论分析和实验表明本算法和MINWAL(W)相比,具有生成候选集数量少、挖掘效率高等特点,特别在项目权值相差不大时,本算法的优势更明显.  相似文献   

7.
基于关联图的频繁闭模式挖掘   总被引:1,自引:1,他引:0  
将关联图的数据挖掘思想应用到频繁闭模式的挖掘中,使用位向量的技术简化项集支持度的计算,构造关联图表示项集间的频繁关系.在此基础上,提出一种频繁闭模式挖掘算法,针对频繁闭模式的特点,结合剪枝策略、子集检测策略、搜索策略等技术手段,优化算法性能.实验结果表明,该算法在时间性能上优于经典的频繁闭模式算法CLOSET.  相似文献   

8.
王璇 《丹东纺专学报》2011,(2):154-158,163
将关联图的数据挖掘思想应用到频繁闭模式的挖掘中,使用位向量的技术简化项集支持度的计算,构造关联图表示项集间的频繁关系。在此基础上,提出一种频繁闭模式挖掘算法,针对频繁闭模式的特点,结合剪枝策略、子集检测策略、搜索策略等技术手段,优化算法性能。实验结果表明,该算法在时间性能上优于经典的频繁闭模式算法CLOSET。  相似文献   

9.
关联规则是数据挖掘研究的一个重要课题,而最大频繁项集的生成是影响关联规则挖掘的关键问题。在已有的频繁集发现算法中,DLG算法通过减少事务数据库的扫描次数,进而有效减少挖掘过程的I/O代价,在阐述DLG算法的实现原理与执行过程的基础上,为进一步减少候选项集的数量,提出一种改进算法DLG,其主要思想是在关联图构造阶段,统计每一个频繁项目的入度,以此作为剪枝的依据,性能分析和比较试验的结果表明该算法性能优良。  相似文献   

10.
发现最大频繁项目集是关联规则挖掘的重要步骤,针对关联规则挖掘中最小支持度发生变化的增量式更新问题,提出了高效发现最大频繁项目集的更新算法.该算法在FP树的基础上增加了记录各项目支持数的表,在头表中增加了域,从而减少了访问事务数据库和FP树的时间,提高了发现最大频繁项目集的效率.  相似文献   

11.
Apriori算法是挖掘关联规则频繁项集的最有影响的算法之一,它通过连接、剪枝等步骤产生频繁项集,进而产生强关联规则。由于面临海量数据,因此将会产生大量的候选项集,尤其是候选2-项集,严重影响了挖掘的效率。提出了一种改进的算法,此算法不产生小项候选集而直接产生大项候选集,从而提高了算法的效率。  相似文献   

12.
关联规则是数据挖掘研究的一个重要课题 ,而最大频繁项集的生成是影响关联规则挖掘的关键问题 .在已有的频繁集发现算法中 ,DLG算法通过减少事务数据库的扫描次数 ,进而有效减少挖掘过程的I/O代价 .在阐述DLG算法的实现原理与执行过程的基础上 ,为进一步减少候选项集的数量 ,提出一种改进算法DLG .其主要思想是在关联图构造阶段 ,统计每一个频繁项目的入度 ,以此作为剪枝的依据 .性能分析和比较试验的结果表明该算法性能优良  相似文献   

13.
在数据挖掘技术中,关联规则可以挖掘发现大量的数据中项集之间有趣的关系或相关联系。冰山查询是关联规则挖掘的一种算法,特别是针对购物篮分析。介绍了数据挖掘的具体应用,使用改进的BUC算法(BUCE算法)以深度优先的处理方法,并综合其他传统算法,提高了处理冰山查询的有效性。同时BUCE算法在数据分组后聚集,减少I/O开销;对分组的数据排序,有利于数据的剪枝处理,将小于最小支持度的分组以后的数据可以全部剪去。所以BUCE算法提高了BUC算法的执行效率  相似文献   

14.
传统的基于支持度—置信度框架的关联规则挖掘方法可能会产生大量不相关的、甚至是误导的关联规则,同时也不能区分正负关联规则。在充分考虑用户感兴趣模式的基础上,采用一阶谓词逻辑作为用户感兴趣的背景知识表示技术,提出了一种基于背景知识的包含正负项目集的频繁模式树,给出了针对正负项目集的约束频繁模式树的构造算法NCFP-Construct,从而提高了关联规则挖掘的效率和针对性,实验结果显示该方法是有效的。  相似文献   

15.
FP__growth算法是基于FP树挖掘频繁项目集的关联规则经典算法,在许多领域中有很高的应用价值。针对传统的FP__growth算法可能产生大量的频繁项集,对FP树的挖掘过程进行了改进,提出了一种项合并剪枝的挖掘策略,进而分析了单路径和多路径的挖掘方法,减少了部分分支的挖掘次数。然后利用MapReduce模型,针对改进的算法并行化实现。实验结果表明该方法提高了算法的执行效率,并且具有良好的加速比和较好的扩展性。  相似文献   

16.
关联规则挖掘算法是通信网告警相关性分析中的重要方法。在处理数量庞大的告警数据库时,算法的效率显得至关重要,而经典的FP-growth算法会产生大量的条件模式树,使得在通信网环境下挖掘关联规则的难度非常大。针对上述问题,提出了一种基于分层频繁模式树的LFPTDP算法,采用分层模式树的方法产生频繁项集,从而避免了产生大量的条件模式树,并用动态剪枝的方法删除大量的非频繁项。算法分析及仿真表明,LFPTDP算法具有较好的时间和空间效率,是一种适合于通信网告警相关性分析的关联规则挖掘算法。  相似文献   

17.
关联规则挖掘的一种改进算法   总被引:4,自引:0,他引:4  
关联规则挖掘是数据挖掘中重要的研究课题,R.Agrawal和R.Srikant于1994年提出的Apriori算法是关联规则挖掘的最有影响的算法,针对Apriori算法中频繁项集产生效率低这个核心问题,本文给出分辨矩阵、分辨向量并提出基于分辨矩阵的改进算法,它能有效提高频繁集的产生效率.  相似文献   

18.
一种基于多层模糊模式的频繁项集剪枝算法的优化   总被引:3,自引:0,他引:3  
运用关联规则对分布式数据库进行数据挖掘是一个常见的模式,为进一步提高在分布式挖掘多层关联规则算法的效率,改善内存的使用率,再次引入模糊理论和有效支持度的概念,并充分考虑有效支持度的闽值和有效支持度的支持频度,提出了一种新的产生频繁项集算法的修改方案,在理论上对此进行了分析和论证,实验证明这种算法的优化效果是明显的、是有用的。  相似文献   

19.
该文针对免疫遗传算法的不足,在分析其特性的基础上,引入了隔离小生境技术,改进交叉算子和变异算子,提出一种改进算法。在基于模糊关联规则挖掘的异常检测中采用本算法优化后的隶属函数,能够扩大正常关联规则集之间的相似度,缩小正常与异常关联规则集之间的相似度,提高异常检测的性能。通过以网络流量为数据的异常检测实验仿真对算法进行了验证。实验结果说明了该算法的可行性和有效性。  相似文献   

20.
根据经典关联规则数据挖掘理论,讨论在给定事务中挖掘出具有强亲密关联性的强频繁集合,该集合是整体关联性最强的集合。首先用FP-Growth Tree算法挖掘出频繁集合,然后对支持度近似频繁集通过矩阵方法计算出复合置信度并得出强频繁集合。通过实例挖掘,对强频繁集合产生的强关联规则进行比较并做出最优选择。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号