首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 28 毫秒
1.
挖掘关联规则是数据挖掘领域的一个重要研究方向,人们已经提出了许多用于发现数据库中关联规则的算法,但对关联规则的增量维护问题的研究较少.深入分析了增量更新情况,使用了目前较高效的最大频繁模式挖掘算法FP-Max,并对其进行改进.基本思想:①基于FP-树;②考虑了数据集中,数据增加情况下FP-树的更新;③对FP-Max算法进行改进来更新、维护已经挖掘出来的最大频繁模式.  相似文献   

2.
多时间序列跨事务关联分析研究   总被引:1,自引:0,他引:1  
论文的研究目的是为了对时间序列的发展趋势进行预测。采用的方法是对多时间序列进行跨事务关联规则分析,利用关联规则中前件和后件的时间差进行预测。提出了跨事务关联规则挖掘ITARM,该算法采用了基于压缩FP-树的、分而治之的挖掘方法。算法在产生了频繁1-项集之后,分别利用1-项集中的项作为约束条件,建立压缩FP-树,挖掘跨事务关联规则。文中给出了算法的主要设计思想和算法的伪代码,并对算法的性能进行了测试。测试结果表明,ITARM算法是一个时间和空间性能都较高的跨事务关联规则挖掘算法。  相似文献   

3.
关联规则中FP树算法的研究与改进   总被引:1,自引:0,他引:1  
传统的基于关联规则的FP-树算法在挖掘频繁项目集算法中应用很广,它在数据挖掘过程中不需要产生候选集,但是该FP-树算法在挖掘较大型数据库时运行速度慢、占用内存大或根本无法构造基于内存的FP-树。为了解决这些问题,本文提出了一种占用内存少、能满足大型数据库挖掘需求的改进的FP树算法。  相似文献   

4.
关联规则是数据挖掘领域的一个重要研究方向。针对关联规则的增量挖掘问题,该文提出一种快速算法FIAFAR。算法使用CAN-树存储原始交易数据库,弥补了FP-树的不足,适应于增量挖掘以及最小支持度变化的情况。采用子父节点指针的设计,可以快速生成条件模式树,提高算法的效率。实验验证了算法的有效性。  相似文献   

5.
一种改进的FP-Growth算法及其在业务关联中的应用   总被引:2,自引:0,他引:2  
基于FP-树的FP-Growth算法在挖掘频繁模式过程中需要递归地产生大量的条件FP-树,效率不高,并且不太适合应用在移动通信业务交叉销售等具有业务约束的关联规则挖掘中。因此,提出了基于项目约束的频繁模式树ICFP-树和直接在此树上进行挖掘的新算法——ICFP-Mine。理论分析和实验结果表明,ICFP-Mine算法在内存占用和时间开销等方面比FP-Growth算法更优越,在移动通信业务交叉销售领域的应用中取得了较好的效果。  相似文献   

6.
在关联规则挖掘算法中基于FP-树的FP-Growth挖掘算法在挖掘频繁模式的过程中需要递归产生大量的条件FP—树,效率不高,FP-Growth算法不太适合应用到入侵中多种要素交叉的关联关系的挖掘中.因为入侵的方法及要素很多,在检测中需要对入侵样本进行条件约束下的定量分析.文中分析入侵检测的特点,提出基于条件频繁项的频繁模式树CP-Tree以及在此树挖掘的改进算法MineCPT.分析与实验结果表明,MineCPT算法在效率和可靠性等方面比FP-Growth 算法更优越,在入侵检测中取得了较好的效果.  相似文献   

7.
关联规则的挖掘大都在用户设置的支持度阈值的限制条件下,产生频繁项目集合。得到关联规则。但是没有相关领域的专门知识,用户很难设置合适的支持度闽值来得到合适的结果。文章在FP-树挖掘算法的基础上,提出一种无支持度设置的关联规则挖掘方法,通过兴趣度的设置动态地得到不同项集的不同支持度。  相似文献   

8.
文章基于FP-增长算法提出了一种新的挖掘复合项关联规则的算法。实验证明,该算法具有良好的可伸缩性和很高的运行效率,解决了复合项关联规则挖掘在实际应用中的效率瓶颈问题,适用于实际的大型数据库。  相似文献   

9.
FP-growth算法是挖掘频繁项集的经典算法,它利用FP-树这种紧凑的数据结构存储事务数据库与频繁项集挖掘相关的全部信息,但对于挖掘加权频繁项集并不合适。分析了现有加权频繁项集挖掘算法中存在的问题,并对FP-树进行改进,构造新的加权FP-树,提出了有效挖掘加权频繁项集的算法。最后举例说明了算法的挖掘过程,并通过实验验证了算法的有效性。  相似文献   

10.
关联规则分析是当前数据挖掘研究的主要模式之一。在介绍关联规则理论的基础上,针对教务管理系统数据的特点,提出了分时挖掘的思想,并对FP-增长算法进行了改进研究。最后是关联规则分析在教务管理系统中的应用实践。  相似文献   

11.
基于排序FP-树的频繁模式高效挖掘算法   总被引:11,自引:0,他引:11  
FP-growth算法是目前较高效的频繁模式挖掘算法之一。在FP-growth算法中,FP-树及条件FP-树的构造和遍历占了算法绝大部分的时间,如果能减少这方面的时间,则有望进一步改善算法的效率。本文给出了一个频繁模式挖掘算法SFP-growth。算法通过将FP-树有序化及采用高效排序算法等措施来提高FP-树构造的效率,从而使算法达到较高的效率。实验结果表明,SFP-growth是一个高效的频繁模式挖掘算法,其性能优于Apriori、Eclat和FP-growtn算法。  相似文献   

12.
在由频繁项集产生关联规则时,利用提升度判断规则前、后件之间的正相关性可以避免产生一些无意义的关联。但是,这并不能保证规则前、后件中的项是正相关的,也不能减少挖掘频繁项集的时间开销。当规则的前件或后件存在负相关的项时,仍然可能产生无意义的关联规则。针对以上问题,基于数学期望,提出了正相关的频繁项集的概念,并改进了一种直接在FP-树中挖掘频繁项集的算法,挖掘出正相关的频繁项集,从而有效地解决以上问题。实验表明,该算法可以大幅度地减少所产生的频繁项集数量,显著地降低了挖掘频繁项集的时间开销。对于大型数据集,尤其是稠密型数据集,该算法具有良好的性能。  相似文献   

13.
一种基于MFP树的快速关联规则挖掘算法   总被引:1,自引:0,他引:1  
在关联规则挖掘FP-Growth算法的基础上,提出一种基于MFP树的快速关联规则挖掘算法。文中给出了MFP算法的工作原理。MFP算法能在一次扫描事务数据库的过程中,把该数据库转换成MFP树,然后对MFP树进行关联规则挖掘。MFP算法比FP-Growth算法减少一次对事务数据的扫描,因此具有较高的时间效率。  相似文献   

14.
在关联规则挖掘FP-Growth算法的基础上,提出一种基于MFP树的快速关联规则挖掘算法。文中给出了MFP算法的工作原理。MFP算法能在一次扫描事务数据库的过程中,把该数据库转换成MFP树,然后对MFP树进行关联规则挖掘。MFP算法比FP-Growth算法减少一次对事务数据的扫描,因此具有较高的时间效率。  相似文献   

15.
OLAP中基于FP-增长的关联规则挖掘   总被引:1,自引:0,他引:1  
关联规则挖掘是一种发现属性问关系的方法,主要用于在商务事务记录中挖掘事务问关系。本文将已经广泛使用的FP-增长(frequent-pattern growth,频繁模式增长)算法进行改进,实现了OLAP中的关联规则挖掘。改进算法分别针对单维、多维、混合维三种关联规则,将多维立方体转化成不同的关系表,通过关系表产生关联规则.并利用立方体中的事实值作为进一步约束,生成了更有价值的规则。  相似文献   

16.
基于FP-树挖掘大数据库的方法及算法PCM   总被引:1,自引:0,他引:1  
该文提出了一种用FP-树挖掘大数据库的新方法及其算法PCM。在该方法中,首先把大数据库划分成子数据库的集合,然后在每个子数据库上构造FP-树并挖掘它,如果子数据库的FP-树不能放进内存,则该方法可递归地用于该子数据库。  相似文献   

17.
快速关联规则挖掘算法研究   总被引:6,自引:0,他引:6  
高俊  施伯乐 《计算机科学》2005,32(3):200-201
本文在分析FP-growth关联规则挖掘算法的基础上,提出了一种称之为MFP的算法,给出了算法的工作原理。MFP算法能在一次扫描事务数据库过程中,把该数据库转换成MFP树,然后对MFP树进行关联规则挖掘。  相似文献   

18.
基于压缩FP-树和数组技术的频繁模式挖掘算法   总被引:2,自引:0,他引:2  
FP-growth算法是目前较高效的频繁模式挖掘算法之一.它只需扫描数据库两次,而且不需要产生和测试候选集,避免了这些费时的工作,因此该算法具有较高的效率.然而,FP-growth算法需要递归地生成大量的条件FP-树,这耗费了大量的存储空间和时间.综合已有的几项优势技术,提出了一种频繁模式挖掘算法CFPmine. 一是采用了基于压缩FP-树的约束子树的挖掘方法,避免在挖掘过程中生成条件FP-树,减少内存占用;二是采用基于数组的技术,减少FP-树的遍历时间,提高算法的效率.另外,在算法中还实现了统一的内存管理.实验结果表明,CFPmine是一个高效的频繁模式挖掘算法,其性能优于Apriori,Eclat和FP-growth算法,而需要的内存却少于FP-growth算法.  相似文献   

19.
文章针对挖掘最大频繁项目集问题,提出了一个基于FP-树的快速算法DMFP,该算法引入了FP-树最大深度和非频繁2-项集,采用自顶向下和自底向上的双向搜索策略来预先对候选集进行有效剪枝,该算法的执行效率较其它同类算法有明显改进。  相似文献   

20.
马慧  汤庸  潘炎 《计算机工程》2006,32(17):132-134
随着各种形式的数据的迅速增长,业务数据中的时态信息挖掘问题受到人们普遍关注。该文提出了一种带有效时间区间的时态关联规则,给出了一种基于FP-树的挖掘方法。该方法利用分区挖掘的思想,以分区为单位表示项集的有效时间区间,并为每个分区构建FP-树,大大简化了对某个项集在其有效时间区间中的出现次数的计算,从而更有效地计算时态置信度。最后用一个例子对该方法的执行过程进行了阐述。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号