首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 81 毫秒
1.
基于极大团和FP-Tree的挖掘关联规则的改进算法   总被引:16,自引:0,他引:16  
融合了关联规则挖掘的FP-Tree算法和图论的极大团理论的优势,做了以下主要工作:(1) 提出了用邻接矩阵的产生频繁2-项集的改进方法;(2) 提出了极大有序频繁集的概念,证明了Head关系的等价性、划分定理、局部复杂性定理和归并收敛值域定理;(3) 提出并实现了基于极大团划分的MaxCFPTree算法,扫描时间复杂性小于O(n2);(4) 做了相关实验,以验证算法的正确性.新方法缓解了项目数量巨大而内存不足的矛盾,提高了系统效率和伸缩性.  相似文献   

2.
最简关联规则及其挖掘算法   总被引:3,自引:0,他引:3       下载免费PDF全文
李杰  徐勇  王云峰  王友 《计算机工程》2007,33(13):46-48
传统关联规则挖掘算法往往产生过多规则而难以被决策者所采用。针对该问题,文章从应用的角度提出了最简关联规则,其特点是后项只包括一种产品,同时追求规则前项产品项数的最小化,在此基础上给出了一种最简关联规则挖掘算法。利用该算法得到的最简关联规则集包括的规则数量大为减少且能得出与全部关联规则集相同的决策,避免了大量的冗余挖掘,提高了挖掘效率和应用效果。  相似文献   

3.
本文根据关联规则和分类规则的概念与表示形式,指出在关联规则挖掘过程中如果指定挖掘与一个确定的项相关联,那么就是分类规则挖掘了,论述了分类规则是特殊情况下的关联规则,并指出在这种特殊情况下,关联规则所具有的特征;然后根据这一论述,提出了一种在关联规则挖掘算法中利用限制条件概率分布来发现分类规则的算法。  相似文献   

4.
基于数组的关联规则挖掘算法   总被引:12,自引:0,他引:12  
孟祥萍  钱进  刘大有 《计算机工程》2003,29(15):98-99,109
提高频繁项集挖掘算法的效率是关联规则挖掘研究的一个重点领域。文章提出了基于数组的关联规则挖掘算法,只需要扫描数据库1次,通过不断减少数据库中的事务个数,并且利用一维数组对候选2-项集进行计数来提高挖掘效率。实验表明,该文所提出的算法效率比经典Apriori算法快2~3倍。  相似文献   

5.
基于关联图的关联规则挖掘算法研究   总被引:15,自引:0,他引:15  
在挖掘关联规则的过程中 ,一个关键的步骤是产生频繁项目集 .本文给出一种基于关联图的关联规则挖掘算法 ,并将它与性能比较好的关联规则挖掘算法 DHP进行了比较 ,结果表明 ,本文的算法优于 DHP算法  相似文献   

6.
针对带有时间属性的海量事务处理问题,提出了一种求最大相关性的最小时间区间(关键时间段KTI)的算法。通过利用极大团把海量的数据项进行有效的划分,降低了后续数据挖掘和决策选择的复杂度。针对特定的含有时间参量的极大团,通过寻找关键时间段(KTI),提高了决策的准确度,同时可以减小分析数据的规模,降低对计算资源的需求。假设事务中各项出现的事件具有相同的概率分布,得到了一种寻找关键时间段(KTI)的算法。从理论上证明了算法的正确性,并对其进行了复杂度分析,通过实际数据验证了算法的可行性。  相似文献   

7.
改进频繁项集算法的效率是提高关联规则挖掘性能的重要环节.本文提出了基于包含频繁1-项集的事务集的关联规则挖掘算法,并通过实例说明了算法的有效性,且与Apriori这一经典算法作了比较。  相似文献   

8.
随着计算机技术和网络通信技术的不断发展,数据信息逐渐成为当前社会各行各业发展的关键。如何在海量数据中挖掘出对企业发展有利的信息是当前各行各业研究热点,也是未来计算机领域发展的主要方向。本文从数据挖掘技术的相关概念出发,对时态约束关联规则挖掘问题及算法,数据分割下的挖掘问题及算法进行了简单分析,结合相关内容简单介绍了交互式的可视化方法。  相似文献   

9.
混合关联规则及其挖掘算法   总被引:1,自引:0,他引:1  
在项目集中引入了负项目,据此定义了关联规则的一种泛化模型——混合关联规则,分析了它的价值,引入了它的挖掘问题的形式描述,并定义了挖掘中的几个关键算法.  相似文献   

10.
改进频繁项集算法的效率是提高关联规则挖掘性能的重要环节,本文提出了基于包含频繁1-项集的事务集的关联规则挖掘算法,并通过实例说明了算法的有效性,且与Apriori这一经典算法作了比较。  相似文献   

11.
一种基于遗传算法的关联规则挖掘方法   总被引:3,自引:0,他引:3  
根据关联规则挖掘的要求与特点,结合遗传算法的思想,提出了一个基于遗传算法的关联规则挖掘方法,并通过实例分析,说明是一种具有实用价值的方法。  相似文献   

12.
基于规则量和提取率度量标准,提出一种使用并行克隆退火遗传策略的关联规则挖掘算法。该算法结合了遗传算法、模拟退火算法和免疫克隆算法的优点,采用克隆、变异和交叉操作获取问题的最优解。理论分析和仿真实验结果表明,该算法能高效、快速地解决关联规则挖掘问题。  相似文献   

13.
赵静 《电脑开发与应用》2012,25(7):16-17,20
A priori算法是经典的关联规则挖掘算法,它利用逐层搜索的迭代方法完成频繁模式的挖掘工作,反复进行连接剪枝操作,思路简单易操作,但也伴随着产生庞大候选集,多次扫描数据库产生巨大I/O开销的问题,提出一种改进算法:基于矩阵的关联规则挖掘算法,同A priori算法比较,该算法只需扫描一遍数据库,就可直接查找k-频繁项集,尤其是当频繁项集较高的时候,该算法具有更高的执行效率,在大数据量的情况下更具有可行性。  相似文献   

14.
基于移项的隐私保护关联规则挖掘算法   总被引:2,自引:1,他引:1  
基于启发式规则的隐私保护关联规则挖掘算法中均通过删除项或增加项改变规则的支持度,对非敏感规则的支持度影响很大。针对上述不足,提出一种将删除项和增加项2种操作相结合的方法,在执行删除项操作后寻找合适的事务,对该事务执行增加项操作。实验结果表明,利用该算法清洗数据库所产生的规则丢失率和相异度均有所下降。  相似文献   

15.
数据立方体上多维多层关联规则挖掘算法   总被引:7,自引:0,他引:7  
重点结合联机分析挖掘的思想,讨论了数据立方体上的多维多层关联规则挖掘。基于数据立方体和FP算法提出并构建了体现概念层次的Hib&Dim FP树和其挖掘算法Hib&Dim FP算法,并把此算法应用于数据立方体上的多维多层关联规则挖掘。最后的实验证明了该算法的有效性。  相似文献   

16.
基于关联规则挖掘中的Apriori算法,在一定条件下,进行局部改进来提高挖掘的时间效率。这种改进本身并不会需要多大的系统开销,但是可以使算法在某些情况下运行得更快些。  相似文献   

17.
基于相关系数的隐私保护关联规则挖掘   总被引:1,自引:0,他引:1       下载免费PDF全文
传统的隐私保护关联规则挖掘算法由于没有考虑规则左右件相关系数的影响,对非敏感规则的支持度影响很大。为了减小这种影响,提出通过调整规则左右件相关系数隐藏敏感规则的算法。该算法通过调整相关系数,使敏感规则的价值无法被发现,从而达到隐藏敏感规则的目的。实验结果表明,该算法的规则丢失率和相异度均有所下降。  相似文献   

18.
数据挖掘是基于数据仓库的知识发现技术,当数据仓库数据海量时,进行穷举搜索是不可行的,必须采取一种有效的搜索策略。遗传算法不仅具有很好的全局搜索能力,同时它能较好的处理数据库中不同属性之间的相互关系。该文论述了如何把遗传算法应用于数据挖掘领域。  相似文献   

19.
刘雨露 《计算机工程》2010,36(16):54-56
针对空间关联规则挖掘算法的冗余计算问题,提出一种基于序号索引的空间关联规则挖掘算法。该算法适用于挖掘单层横向空间的关联规则,在自底向上和自顶向下的搜索过程中,用定序操作产生序号索引,通过序号索引在双向挖掘过程中修剪重复候选项和删除冗余计算,以提高算法效率。实验结果证明该算法比现有的算法更快速有效。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号