首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 78 毫秒
1.
可信关联规则及其基于极大团的挖掘算法   总被引:3,自引:1,他引:3  
肖波  徐前方  蔺志青  郭军  李春光 《软件学报》2008,19(10):2597-2610
目前的关联规则挖掘算法主要依靠基于支持度的剪切策略来减小组合搜索空间.如果挖掘潜在的令人感兴趣的低支持度模式,这种策略并非有效.为此,提出一种新的关联模式—可信关联规则(credible association rule,简称CAR),规则中每个项目的支持度处于同一数量级,规则的置信度直接反映其可信程度,从而可以不必再考虑传统的支持度.同时,提出MaxcliqueMining算法,该算法采用邻接矩阵产生2-项可信集,进而利用极大团思想产生所有可信关联规则提出并证明了几个相关命题以说明这种规则的特点及算法的可行性和有效性.在告警数据集及Pumsb数据集上的实验表明,该算法挖掘CAR具有较高的效率和准确性.  相似文献   

2.
针对构建FP-Tree时存在的大量内存消耗问题,提出了CCFP(constraint clip FP-tree)算法,该算法利用有项和缺项约束对事务数据库进行修剪后构造简化的FP-Tree,经再一次扫描后得到关联规则.实验结果表明:该算法较一般的FP-Tree算法能节省大量的内存空间,同时,运行效率也略有提高.  相似文献   

3.
改进频繁项集算法的效率是提高关联规则挖掘性能的重要环节.本文提出了基于包含频繁1-项集的事务集的关联规则挖掘算法,并通过实例说明了算法的有效性,且与Apriori这一经典算法作了比较。  相似文献   

4.
改进频繁项集算法的效率是提高关联规则挖掘性能的重要环节,本文提出了基于包含频繁1-项集的事务集的关联规则挖掘算法,并通过实例说明了算法的有效性,且与Apriori这一经典算法作了比较。  相似文献   

5.
关联规则挖掘算法的改进   总被引:2,自引:1,他引:2  
为了提供一种更加准确高效的关联规则算法,在传统的Apriori算法的基础上引入分而治之的理念和加权的思想。先把数据库分成互不相交的块,根据需求分析从每一个块中产生用户感兴趣的子集,把所有的子集合并成挖掘对象,再利用普通的关联规则算法产生频繁项集,最后在该项集的基础上产生加权频繁项集。该算法基本上克服了传统Apriori算法的缺点,从而大大地提高了运算效率,最大限度解决了“项集生成瓶颈”问题,并且使得生成的关联规则更加科学、准确。  相似文献   

6.
为了提供一种更加准确高效的关联规则算法,在传统的Apriori算法的基础上引入分而治之的理念和加权的思想.先把数据库分成互不相交的块,根据需求分析从每一个块中产生用户感兴趣的子集,把所有的子集合并成挖掘对象,再利用普通的关联规则算法产生频繁项集,最后在该项集的基础上产生加权频繁项集.该算法基本上克服了传统Apriori算法的缺点,从而大大地提高了运算效率,最大限度解决了"项集生成瓶颈"问题,并且使得生成的关联规则更加科学、准确.  相似文献   

7.
关联规则和分类规则挖掘算法的改进与实现   总被引:5,自引:0,他引:5  
陶树平  屠颖 《计算机工程》2003,29(15):100-101,187
对Apriori关联规则挖掘算法提出了一种改进方法,使其可以有效地压缩数据规模,提高了原Apriori算法的执行效率。此外,还对OCI分类规则挖掘算法提出了改进,扩展了该算法的适用范围。同时,该采用这两个改进算法实现了一个数据挖掘原型系统。  相似文献   

8.
针对带有时间属性的海量事务处理问题,提出了一种求最大相关性的最小时间区间(关键时间段KTI)的算法。通过利用极大团把海量的数据项进行有效的划分,降低了后续数据挖掘和决策选择的复杂度。针对特定的含有时间参量的极大团,通过寻找关键时间段(KTI),提高了决策的准确度,同时可以减小分析数据的规模,降低对计算资源的需求。假设事务中各项出现的事件具有相同的概率分布,得到了一种寻找关键时间段(KTI)的算法。从理论上证明了算法的正确性,并对其进行了复杂度分析,通过实际数据验证了算法的可行性。  相似文献   

9.
肖波  张亮  徐前方  蔺志青  郭军 《软件学报》2010,21(4):659-671
超团模式是一种新型的关联模式,这种模式所包含的项目相互间具有很高的亲密度.超团模式中某个项目在事务中的出现很强地暗示了模式中其他项目也会相应地出现.极大超团模式是一组超团模式更加紧凑的表示,可被用于多种应用.挖掘这两种模式的标准算法是完全不同的.提出一种基于FP-tree(frequent pattern tree)的快速挖掘算法——混合超团模式增长(hybrid hyperclique pattern growth,简称HHCP-growth),统一了两种模式的挖掘.算法采用递归挖掘方法,并应用多种有效的剪枝策略.提出并证明几个相关命题来说明剪枝策略的有效性和算法的正确性.实验结果表明,HHCP-growth算法相对于标准的超团模式挖掘算法和极大超团模式挖掘算法都具有更高的效率,尤其对于大数据集或在低支持度条件下更为显著.  相似文献   

10.
基于规则量和提取率度量标准,提出一种使用并行克隆退火遗传策略的关联规则挖掘算法。该算法结合了遗传算法、模拟退火算法和免疫克隆算法的优点,采用克隆、变异和交叉操作获取问题的最优解。理论分析和仿真实验结果表明,该算法能高效、快速地解决关联规则挖掘问题。  相似文献   

11.
基于频繁模式树的负关联规则挖掘算法   总被引:1,自引:0,他引:1       下载免费PDF全文
典型的正关联规则仅考虑事务中所列举的项目。负关联规则不但要考虑事务中所包含的项目集,还必需考虑事务中所不包含的项目,它包含了非常有价值的信息。然而,对于负关联规则的研究却很少,仅有的几种算法也存在一定的局限性。为此,该文提出了一种基于FP-tree的负关联规则挖掘算法,该算法不但可以发现事务数据库中所有的负关联规则,而且整个过程只需扫描事务数据库两次,算法是有效和可行的。  相似文献   

12.
目前已提出了许多快速的关联规则挖掘算法,实际上用户只关心部分关联规则,如他们仅想 知道包含指定项目的规则.当这些约束被用于数据预处理或将它结合到数据挖掘算法中去时 ,可以显著减少算法的执行时间.为此,考虑了一类包含或不包含某些项目的布尔表达式约 束条件,提出了一种快速的基于FP-tree的约束最大频繁项目集挖掘算法CMFIMA,并对其更 新问题进行了研究,提出了一种增量式更新约束最大频繁项目集挖掘算法CMFIUA.  相似文献   

13.
关联规则挖掘向来是数据挖掘的一个重要领域,挖掘算法也层出不穷.本文在深入分析了FP树特性的基础上,改进了FP树构造过程,通过一次扫描事务数据库生成FP树.缩短了关联规则挖掘时间,提高了效率,实验验证了其有效性.  相似文献   

14.
关联规则提取中对Apriori算法的一种改进   总被引:25,自引:0,他引:25  
关联规则的提取是数据挖掘中的重要研究课题,该文对关联规则提取中的Apriori算法进行了深入研究,指出了该算法的某些不足,提出了一种改进算法。实验结果表明,该算法性能明显优于Apriori算法,具有较高的推广价值。  相似文献   

15.
一种基于FP树的挖掘关联规则的增量更新算法   总被引:15,自引:0,他引:15  
挖掘关联规则是数据挖掘领域的一个重要研究方向.人们已经提出了许多用于高效地发现大规模数据库中关联规则的算法,但对关联规则维护问题的研究却比较少.该文在FP树的基础上,引入支持度函数的慨念,对FP树进行改造,提出了一种关于挖掘关联规则的增量更新算法IFP—growth.该算法既考虑了数据集中数据的增加.同时又考虑了数据集中数据的减少等情况下关联规则的维护问题,并且还可以把增量更新的5种情形简化为3种情形.使用本算法来挖掘关联规则可以避免生成大量的候选项目集,而且非常高效.  相似文献   

16.
陈涛  张玮 《微机发展》2007,17(1):139-141
在研究关联规则挖掘算法的基础上,对并行关联规则算法进行了比较全面的分析,并给出了并行数据挖掘的计算框架。提出了一个以计算服务器为中心节点的并行挖掘算法,可以发挥各局部节点的优势,无需各局部节点进行通信,减少了各局部节点的通信负荷。通过理论分析和实验数据验证,该算法具有较好的可扩展性和海量处理能力,特别是在节点数目较多的情况下更显示出优势。  相似文献   

17.
研究了多层关联规则挖掘的理论和方法,提出了一种基于FP-tree的快速挖掘算法FAMML_FPT。该算法不仅实现了同层次关联规则的挖掘,也能实现跨层次关联规则的挖掘,其中引入了修补项、跨层修补项的概念,以便从低到高逐层建立FP-tree,有效减少了扫描数据库的次数,且不用产生大量的候选项集,提高了数据挖掘的效率。  相似文献   

18.
基于压缩FP-树和数组技术的频繁模式挖掘算法   总被引:2,自引:0,他引:2  
FP-growth算法是目前较高效的频繁模式挖掘算法之一.它只需扫描数据库两次,而且不需要产生和测试候选集,避免了这些费时的工作,因此该算法具有较高的效率.然而,FP-growth算法需要递归地生成大量的条件FP-树,这耗费了大量的存储空间和时间.综合已有的几项优势技术,提出了一种频繁模式挖掘算法CFPmine. 一是采用了基于压缩FP-树的约束子树的挖掘方法,避免在挖掘过程中生成条件FP-树,减少内存占用;二是采用基于数组的技术,减少FP-树的遍历时间,提高算法的效率.另外,在算法中还实现了统一的内存管理.实验结果表明,CFPmine是一个高效的频繁模式挖掘算法,其性能优于Apriori,Eclat和FP-growth算法,而需要的内存却少于FP-growth算法.  相似文献   

19.
关联规则挖掘是数据挖掘中的一个重要研究内容.为了高效、快速地从事务数据库中挖掘出频繁项集,针对数据挖掘的经典关联规则Apriori算法的瓶颈问题提出了改进的方法.算法将事物数据库映射到布尔型数组中,然后所有的操作都针对数组元素值展开.这样大大减少了数据库的扫描次数.算法利用数组的随机访问特性及布尔型数据的简单"与"操作,直接产生频繁项集,而不产生大量的候选项集.经理论分析和实验结果显示该算法在效率上明显优于Apriori 算法.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号