首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
许多现实数据库都存在时态语义问题,因此在挖掘关联规则时附加上时态约束会使规则更具有实际意义。但目前提出的大多数时态关联规则挖掘算法,一般都认为每个数据项的重要性相同,而从决策者角度出发,往往会优先考虑利润较高的项目。提出了一种加权时态关联规则挖掘算法,以项目的生命周期作为时间特征,允许用户设定不同的项目权重。实验结果证明,该算法不仅能有效地发现加权时态关联规则,而且挖掘出的规则更有价值。  相似文献   

2.
时态关联规则挖掘是针对在一段时间范围内的关联挖掘,在现实中有较多的应用。现有的大多数时态关联挖掘算法或者需要多次扫描数据库,或者没有考虑各个项在数据集上出现或结束时间上的不同,因而挖掘性能受到较大的制约。为此,本文提出一种增量式的面向具有不同时间出现与结束的项的时态关联规则挖掘算法。为减少存储方面的开销,只需保存已挖掘过的历史数据集中的频繁1项集。为了减少数据的扫描量,通过有效的剪枝策略,有选择性地扫描相关事务项,至多只需扫描一次完整的数据库。实验证明,该算法具有较好的挖掘性能。  相似文献   

3.
基于频繁模式树的负关联规则挖掘算法   总被引:1,自引:0,他引:1       下载免费PDF全文
典型的正关联规则仅考虑事务中所列举的项目。负关联规则不但要考虑事务中所包含的项目集,还必需考虑事务中所不包含的项目,它包含了非常有价值的信息。然而,对于负关联规则的研究却很少,仅有的几种算法也存在一定的局限性。为此,该文提出了一种基于FP-tree的负关联规则挖掘算法,该算法不但可以发现事务数据库中所有的负关联规则,而且整个过程只需扫描事务数据库两次,算法是有效和可行的。  相似文献   

4.
基于频繁模式树的分布式关联规则挖掘算法   总被引:1,自引:0,他引:1  
何波 《控制与决策》2012,27(4):618-622
提出一种基于频繁模式树的分布式关联规则挖掘算法(DMARF).DMARF算法设置了中心结点,利用局部频繁模式树让各计算机结点快速获取局部频繁项集,然后与中心结点交互实现数据汇总,最终获得全局频繁项集.DMARF算法采用顶部和底部策略,能大幅减少候选项集,降低通信量.理论分析和实验结果均表明了DMARF算法是快速而有效的.  相似文献   

5.
时态关联规则是指带有时态约束的关联规则,针对现有的大多数时态关联规则挖掘算法并没有考虑数据项的不同重要性,提出了一种新的加权时态关联规则挖掘算法。算法以项目的生命周期作为时间特征,并且允许用户设定不同的项目权重。算法采用了树和矩阵的数据存储结构,挖掘过程中只需扫描一次数据库,同时利用向量之间的交集操作加快了加权支持度的计算速度。仿真实验表明,优化算法具有良好的挖掘效率。  相似文献   

6.
利用时态关联规则的分析,可以得到一系列相关性的项目集合,从而为决策提供更加有利的帮助和支持。在研究了传统的静态关联规则的基础上,提出了一种以交易规模的变化率为处理对象,即考虑各类项目交易量的变动状况的时态关联规则的表述与挖掘方法,并对其表述形式及算法实现进行了探讨。  相似文献   

7.
基于改进FP-树的最大模式挖掘算法   总被引:2,自引:0,他引:2  
频繁模式挖掘是数据挖掘领域中的一个非常重要的分支,但是由于其内在的计算复杂性,挖掘密集型数据的频繁模式完全集非常困难而且数量往往大得惊人,难以理解和应用。最大频繁模式(最大模式)压缩隐含了所有的频繁模式,存储所占用的空间远远小于完全集,因而最大模式挖掘具有十分重要的意义。该文改进了传统的FP-树结构并提出了一种有效的基于改进FP-树的最大模式挖掘算法IFP-M ax;通过引入后缀子树的概念,算法在挖掘过程中不用生成最大频繁模式候选集,从而大大提高了算法的时间效率和空间可伸缩性。实验表明,IFP-M ax的挖掘速度比M AFIA和GenM ax大约快一个数量级。  相似文献   

8.
基于PC-树的关联规则挖掘方法   总被引:4,自引:0,他引:4  
关联规则是数据挖掘的一种常用方法,特别是用在货篮分析中,而关联规则的经典算法Apriori及其改进算法的时间复杂度和空间复杂度都比较高,对于数据库更新、用户定义最小支持度等动态数据挖掘的成本太高。针对这种情况,提出了用PC-树寻找频繁项集的算法,实现高效的动态数据挖掘。  相似文献   

9.
基于改进FP-树的最大项目集挖掘算法*   总被引:1,自引:0,他引:1  
挖掘最大频繁项目集是多种数据挖掘应用中的关键问题。FP-growth算法是目前最有效的频繁模式挖掘算法之一,其在挖掘最大项目集时要递归生成大量的条件FP-树,存在时空效率不高的问题。于是结合改进的FP-树,提出了一种快速挖掘最大项目集的算法。该算法利用改进的FP-树是单向的且每个节点只保留指向父节点的指针,可以节约大量的存储空间;同时引入项目序列集和它的基本操作,使挖掘最大频繁项目集时不生成含大量候选项目的集合或条件FP-树,可以快速地挖掘出所有的最大频繁项目集。实例分析证明所提出的算法是可行的。  相似文献   

10.
一种新的关联规则挖掘算法研究   总被引:1,自引:0,他引:1  
:通过分析数据关联的特点和已有的关联规则挖掘算法 ,在定量描述的准确性和算法高效性方面作了进一步研究 ,提出了更准确的支持度和置信度定量描述方法和关联关系强弱的定量描述方法。同时 ,改进了 FP-growth挖掘算法 ,并应用于中医舌诊临床病例数据库挖掘实验中 ,可成功准确地提取中医舌诊诊断规则。测试结果表明该算法速度快、准确度高。  相似文献   

11.
基于FP-tree的最大频繁模式挖掘算法   总被引:11,自引:0,他引:11  
冯志新  钟诚 《计算机工程》2004,30(11):123-124
在FP-tree结构的基础上提出了最大频繁模式挖掘算法FP-Max。算法FP-Max只需要两次数据库扫描,挖掘过程不会产生候选项集。实验表明.算法FP-Max在挖掘密集型数据集方面是高效的。  相似文献   

12.
大型数据库中关联规则的向量法挖掘   总被引:6,自引:1,他引:6  
提出一个基于向量运算的崭新的挖掘算法, 它特别适用于并行运算,并且,在整个挖掘过程中,只需扫描数据库一次,而传统的Apriori算法需要多次扫描数据库。因此,数据挖掘效率大大提高。  相似文献   

13.
研究了多层关联规则挖掘的理论和方法,提出了一种基于FP-tree的快速挖掘算法FAMML_FPT。该算法不仅实现了同层次关联规则的挖掘,也能实现跨层次关联规则的挖掘,其中引入了修补项、跨层修补项的概念,以便从低到高逐层建立FP-tree,有效减少了扫描数据库的次数,且不用产生大量的候选项集,提高了数据挖掘的效率。  相似文献   

14.
虽然FP-Growth算法能够有效地从数据库中挖掘频繁模式,但如何由其挖掘出的频繁模式中高效地产生关联规则仍是一个相当复杂的问题。该文提出了用于组织频繁模式的线索频繁模式树(TFPT)和一个从TFPT中挖掘关联规则的高效算法—最短模式优先算法(SPF)。挖掘模式Y的关联规则时,SPF算法应用了两个优化策略,避免了对大量的不可能成为规则XY-X左部的Y的子集的检查,从而获得了很好的性能。实验表明:与类FP-Growth算法结合时,SPF算法运行速度远远快于Apriori算法,并有相当好的可伸缩性。  相似文献   

15.
关联规则挖掘可以发现大量数据中项集之间相关联系的知识,这些重要信息是关于这些数据的整体特征描述以及对其发展趋势的预测,对决策的制定有着重要的参考价值。主要介绍了数据挖掘和关联规则挖掘的概念,并对数据挖掘经典算法Apriori的进行了分析与改进,算法的改进可以有效地减少对数据库的扫描次数,使挖掘的效率更好更快。  相似文献   

16.
一个改进的关联规则的频繁项目集数据挖掘算法   总被引:1,自引:0,他引:1  
吴振光 《计算机科学》2007,34(9):145-147
在关联规则中的Apriori算法,具有天生的缺陷,运行效果很不理想。为了克服Apriori算法的缺点,本文提出了一个改进的算法:在产生频繁项目集组合时,只需扫描数据库一次,这样就可以有效率地降低I/O的存取时间,更快速地找出符合使用者需求的关联规则。仿真实验表明,该算法是有效的。  相似文献   

17.
佟强  周园春  吴开超    阎保平 《计算机工程》2007,33(10):34-35,69
提出了一种新的挖掘量化关联规则的方法.该方法使用聚类算法把数据库中的交易记录分成若干个簇,把簇投影到数值型属性所在的域,形成重叠的、有意义的区间.实验结果显示,这种方法能够有效地挖掘量化关联规则,并且能够发现以前的算法可能遗漏的重要的规则.  相似文献   

18.
在分布式关联规则挖掘中,首先需要解决分布式环境下的聚类分区问题。该文基于CURE的工作原理,提出了D-CURE算法。实验证明,D-CURE算法可以很好地解决在分布式环境下的聚类分区问题。  相似文献   

19.
关联规则算法的实现与改进   总被引:11,自引:0,他引:11  
关联规则作为一种数据挖掘的工具,它能够发现数据项集之间有趣的关联。在关联规则的算法中,Apriori算法是其中的关键算法之一。面对大量复杂的数据集,怎样选择数据结构,怎样优化处理过程,对于此算法的性能将会十分重要。该文首先介绍了关联规则的原理和Apriori算法的实现,然后提出了对该算法的若干改进,例如:采用树型结构存取频繁项集,使用三种缓存优化的方法等。这些优化都能够在整体上提高算法的效率。对于大数据项,试验显示,这些改进能够正确、有效、快速地实现Apriori算法。  相似文献   

20.
关联规则是数据挖掘领域的一个重要研究方向。针对关联规则的增量挖掘问题,该文提出一种快速算法FIAFAR。算法使用CAN-树存储原始交易数据库,弥补了FP-树的不足,适应于增量挖掘以及最小支持度变化的情况。采用子父节点指针的设计,可以快速生成条件模式树,提高算法的效率。实验验证了算法的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号