首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 328 毫秒
1.
该文旨在不丢失任何信息的情况下减少关联规则的生成数量,分析了关联规则的生成过程中如何只产生某个频繁项集对应的最小关联规则集。通过最小关联规则集中的规则就可得到此频繁项集对应所有的关联规则,在实际应用中大大地提高了用户从关联规则中提取相关信息并做出正确决策的效率。  相似文献   

2.
孟军  王蓬  张静  王秀坤 《计算机科学》2013,40(1):183-186,217
传统关联规则挖掘可能会得到大量的、杂乱的规则,它们对用户来说是不相关的或不感兴趣的。提出最小关联规则集和项集强依赖关系的概念,以实现基于项集依赖的最小关联规则挖掘算法。其不仅可以避免验证某一频繁项集下的所有非空真子集是否可形成关联规则,还可以通过删除那些过于复杂、有重复信息的规则来进一步简化传统规则集合。通过最小关联规则集可推导得到大多数冗余规则的支持度和置信度,实现了传统规则集的一种近似无损表述。采用UCI机器学习库中数据集进行实验,结果表明提出的方法得到的规则数量明显减少,且规则更加简短、无重复信息,为最小关联规则挖掘提供了更好的方法。  相似文献   

3.
罗光蕊  刘杰 《计算机工程》2010,36(12):36-38
针对关联规则数量巨大并且存在极大冗余的问题,提出无冗余告警关联规则产生算法。从规则本身的关联性和等效性上定义规则的冗余性,通过构造频繁闭项集邻接图发现无冗余告警关联规则,用户可以通过发现的规则推导出其余所有冗余规则,并且得到用户所需的规则形式。该方法不仅能够减少关联规则数量,而且不会带来规则丢失。仿真结果表明,在相同的数据集、最小支持度门限和最小置信度门限条件下,无冗余关联规则数量和产生时间都小于冗余关联规则数量和产生时间,支持度门限越小,差距越显著。  相似文献   

4.
张军  陈凯明 《计算机工程》2008,34(9):76-77,8
为缩减关联规则存储空间和方便查询关联规则,提出一种前件为单一项目的最小预测集算法。利用集合枚举树找到最大频繁项 目集,据此来挖掘最小预测集。对规则扩展的有效性进行证明。实验结果表明,通过该算法得到的最小预测集比传统方法小1个数量级。  相似文献   

5.
基于集合枚举树的关联规则生成算法   总被引:2,自引:0,他引:2  
在经典算法中由频繁项集生成关联规则需要生成频繁项集的所有非空子集作为候选后件集。李雄飞对此做出改进,提出逐层搜索后件的宽度优先算法。求下集极大元的Boundary算法也可用于求所有关联规则后件。论文提出一个深度优先算法GRSET(GenerateRulesbyusingSet-EnumerationTree),该算法利用集合枚举树,按照深度优先的方法逐一找出所有关联规则后件并得到相应的关联规则。通过实验对这三种算法进行比较,结果显示GRSET算法效率较高。  相似文献   

6.
文章研究了两个基本的关联规则推导关系,在此基础上建立了最大频繁集的关联规则矩阵视图,把一个频繁集生成的所有规则全部展现在一个矩阵中,并通过研究矩阵中的各规则元素的关系,得到一个频繁集或规则矩阵的基集和核(即最小规则集),可以从大型事务数据库生成的大量关联规则中挖掘出最小规则集和有用户感兴趣的规则。  相似文献   

7.
刘萍  别荣芳 《计算机应用》2005,25(6):1376-1378,1381
生成关联规则算法FAS,能够迅速区分某频繁项集的所有关联规则的前件和后件,生成给定频繁项目集的关联规则。基于FAS算法,设计并实现了一个基于最近挖掘结果的数据挖掘系统AR—Miner。该系统主要包括数据预处理、频繁集初始计算、频繁集更新计算、频繁集选择、关联规则生成五部分,不仅实现了关联规则挖掘的可视化和生成结果按“支持度一可信度”形式的可视化,还为基于频繁集的交互式挖掘提供了方便、友好的界面。  相似文献   

8.
基于数据仓库的高效关联规则的挖掘   总被引:2,自引:0,他引:2  
提出在基于数据仓库的关联规则发现中生成最小关联规则集来代替完全关联规则集,最小关联规则集必须具备两个条件:(1)最小关联规则集是最小、最简单的关联规则集合;(2)最小关联规则集与完全关联规则集有相同的置信度。通过最小关联规则集,可以有效地剪除弱关联规则,大幅度减少候选频繁项目集,从而提高规则发现效率。是后,在传统经典算法Apriori基础上设计了一个相应的高效算法。  相似文献   

9.
关联规则的发现是数据挖掘的一个重要问题.当最小支持度和最小可信度变化时,如何利用原来的挖掘结果快速得到新的频繁项目集和关联规则在实践上具有重要的意义.本文提出一种基于分治策略的关联规则增量式更新技术,充分利用了原来获得的结果,同时在开采过程中使用对某些频繁项目集加标志tag的方法来提高开采效率  相似文献   

10.
一种有效的基于图的关联规则挖掘算法   总被引:2,自引:0,他引:2  
陈明  史忠植  王文杰 《计算机应用》2006,26(11):2654-2656
基于图的关联规则挖掘算法是一种通过构建关联图并直接生成候选频繁项集,进而验证得到所有频繁项集的算法。在该算法中,对候选项集的验证操作占用了大量的时间,为此提出了改进算法。改进主要体现在两个方面:按支持度降序对频繁1项重新编号再构建关联图;利用Apriori性质删减用来生成候选项集的冗余扩展项节点。实验结果表明,在最小支持度阈值较小时,改进算法有效减少了冗余的候选频繁项集,提高了算法的性能。  相似文献   

11.
一种有效且无冗余的快速关联规则挖掘算法   总被引:8,自引:0,他引:8  
刘乃丽  李玉忱  马磊 《计算机应用》2005,25(6):1396-1397
关联规则的挖掘是数据挖掘的一个重要研究领域。传统算法进行关联规则挖掘时,或者生成规则的效率很低,或者生成的关联规则之间存在着大量的冗余,或者挖掘出的规则的支持度和置信度都很高,但却是无趣的、甚至是虚假的规则,且不能产生带有否定项的规则。提出了一种新的算法MVNR(MiningValidandnon RedundantAssociationRulesAlgorithm),利用频繁项集的极小子集集合很好的解决了上述问题。  相似文献   

12.
为了有效提高关联规则挖掘算法处理数据库的效率,在研究基于矩阵的关联规则挖掘算法的基础上,提出了改进的关联规则挖掘算法DMApriori,并选取程序模拟超市购物产生的4个试验数据集,应用DMapriori算法对该数据集进行了关联规则挖掘;实验结果表明,该算法能平均提高关联规则挖掘时间20%;在计算数据库中的频繁项集时,通过有效裁剪布尔矩阵,使算法逐层扫描的数据量大大减少,并且对每个项集计数时,只扫描部分数据,提高了关联规则挖掘算法的性能。  相似文献   

13.
频繁项集挖掘是关联规则挖掘的核心部分,目前大多数关于关联规则挖掘的研究都集中于如何提高频繁项集挖掘的效率,然而在实际应用中,决策者面对的是最终从频繁项集中生成的规则集,因此优化规则的生成过程及生成规则同样值得重视。本文提出频繁项集的子集树这一模式来生成关联规则,不仅简化规则的生成过程还可缩小决策者面对的规则集,更便于规则的增量更新。  相似文献   

14.
本文采用一种基于布尔矩阵的频繁集挖掘算法。该算法直接通过支持矩阵行向量的按位与运算来找出频繁集,而不需要Apriori算法的连接和剪枝,通过不断压缩支持矩阵,不仅节约了存储空间,还提高了算法的效率。  相似文献   

15.
基于幂集的关联规则挖掘算法研究   总被引:13,自引:2,他引:13  
首次提出了利用幂集作为挖掘关联规则的工具,给出了基于幂集的关联规则挖掘算法。该算法有效解决了传统算法中需对数据库多次扫描的不足,实现了对数据库一次扫描就可挖掘出所有频繁集的功能。  相似文献   

16.
一种改进的加权关联规则挖掘方法   总被引:4,自引:0,他引:4       下载免费PDF全文
考虑属性数量和属性权值对关联规则的影响,提出一种新的加权支持度和加权置信度计算方法,在挖掘加权关联规则时通过改进加权支持度设置模型保持Apriori算法的频繁集向下封闭特性。与Apriori算法和水平加权关联规则挖掘方法的比较结果证明该方法能快速有效地挖掘重要的关联规则。  相似文献   

17.
基于子规则的关联规则生成算法   总被引:4,自引:0,他引:4  
关联规则是数据挖掘中重要的课题之一。传统的由频繁项目集产生关联规则的方法由于要考虑频繁项目集的每一个非空子集,当频繁项目集的长度较长时代价较大。文中提出用K项子频繁项目集导出关联规则以后得到的有用信息以指导K 1项父频繁项目集产生强关联规则,由于利用了前面已有的有用信息,当频繁模式长度很长时,或者可信度较高时,效率尤其显著。  相似文献   

18.
基于人工免疫系统的关联规则挖掘算法   总被引:4,自引:0,他引:4  
给出了一个基于人工免疫系统的关联规则挖掘算法。将训练数据作为抗原,候选模式作为人工识别球(ARB),通过免疫学习生成频繁模式并以免疫记忆的形式加以保存,最终生成关联规则。所给的应用实例说明本算法是可行、有效的。  相似文献   

19.
One of the obstacles of the efficient association rule mining is the explosive expansion of data sets since it is costly or impossible to scan large databases, esp., for multiple times. A popular solution to improve the speed and scalability of the association rule mining is to do the algorithm on a random sample instead of the entire database. But how to effectively define and efficiently estimate the degree of error with respect to the outcome of the algorithm, and how to determine the sample size needed are entangling researches until now. In this paper, an effective and efficient algorithm is given based on the PAC (Probably Approximate Correct) learning theory to measure and estimate sample error. Then, a new adaptive, on-line, fast sampling strategy - multi-scaling sampling - is presented inspired by MRA (Multi-Resolution Analysis) and Shannon sampling theorem, for quickly obtaining acceptably approximate association rules at appropriate sample size. Both theoretical analysis and empirical study have showed that the sampling strategy can achieve a very good speed-accuracy trade-off.  相似文献   

20.
本文在对关联规则挖掘中Apriori算法的深入研究和分析的基础上,发现并指出了该算法存在的不足,改进了在由K阶频繁项集生成K+1阶候选项集时的连接和剪枝策略及对事务数据库的处理方式,它在时间和空间上提高了Apriori算法的效率。根据改进后的算法提出了入侵检测方法,该方法实现了规则库的自动更新,极大地提高了系统的安全性和可靠性。实验结果表明,该方法明显提高了频繁项目集的生成效率,入侵检测系统知识规则库的生成效率也得到改善。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号