首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
结合自底向上与自顶向下的搜索策略,提出一种快速发现最大频繁项目集的算法.该算法利用非频繁项目集对候选最大频繁项目集进行剪枝和降维,减少了候选最大频繁项目集的数量,缩小了搜索空间,提高了算法的效率.算法分析和实验表明,该算法是一种有效、快速的算法.  相似文献   

2.
宋卫林  徐惠民 《计算机工程与设计》2007,28(7):1493-1496,1500
为了有效地解决客户序列视图数据库的数据挖掘问题,借鉴了关联规则挖掘最大频繁项目集DMFIA算法的相关思想.详细阐述了该算法,针对原算法不能有效地解决客户序列视图数据库的数据挖掘这一问题,在原算法的基础上结合序列模式提出了改进的DMFIA算法,并在原算法的基础上有了较大的改进.为了验证算法的正确性,运用Ora-cle9i数据库的PL/SQL进行了相应的验证.实验结果证实了改进算法的有效性和实用性,并具有较好的创新性和理论价值.  相似文献   

3.
基于FP-tree的最大频繁项目集挖掘算法   总被引:1,自引:0,他引:1  
最大频繁项目集挖掘是数据挖掘领域最重要的基本问题之一,在分析已有算法的基础上提出了FP-MMFI算法,它是对FP-growth算法在最大频繁项目集挖掘上的扩展.提出了频繁路径的概念,用它可以有效地对FP-tree进行压缩和缩小搜索空间,同时使用投影的方法对超集检测进行了优化,减少了项目匹配的次数.最后实验结果表明,该算法在性能上优于已有的同类算法.  相似文献   

4.
阐述了挖掘最大频繁项目序列集ISS_DM算法,针对该算法不能有效地解决客户序列视图数据库的数据挖掘问题,结合序列模式提出了改进的ISS_DM算法,并进行了相应的验证.实践证明,改进后的算法同原算法相比,对相同的数据量进行挖掘,算法执行时间明显减少,效益较高.  相似文献   

5.
一种新的最大频繁项目集挖掘算法   总被引:5,自引:0,他引:5  
马丽生  邓辉文  齐逸 《计算机应用》2006,26(11):2670-2673
最大频繁项目集挖掘是数据挖掘领域最重要的基本问题之一,在分析已有算法的基础上,提出了一种新的挖掘最大频繁项目集的算法,实验表明该算法在性能上优于已有的同类算法。  相似文献   

6.
何婧  王丽珍  邹力鹍  张忠玉 《计算机工程》2003,29(16):62-64,124
提出了一种快速发现最大频繁项目集的算法MFIA。该算法只需扫描一遍数据库,通过构造数据库事务的相应项目序列来发现最大频繁项目集。实验表明:MFIA算法性能稳定,可扩展性好,效率高。  相似文献   

7.
最大频繁项目集挖掘技术研究与展望   总被引:1,自引:1,他引:1  
钱进 《微计算机应用》2005,26(6):652-654
提高最大频繁项目集挖掘算法的效率是关联规则挖掘研究一个重点领域.本文主要对影响最大频繁项目集挖掘效率的数据分布、搜索策略、支持度计算及剪枝策略等技术进行了研究,并对已提出的最大频繁项目集挖掘算法进行了分析.  相似文献   

8.
一种基于FP-tree的最大频繁项目集挖掘算法   总被引:7,自引:0,他引:7  
刘乃丽  李玉忱  马磊 《计算机应用》2005,25(5):998-1000
挖掘关联规则是数据挖掘领域中的重要研究内容,其中挖掘最大频繁项目集是挖掘关联规则中的关键问题之一,以前的许多挖掘最大频繁项目集算法是先生成候选,再进行检验,然而候选项目集产生的代价是很高的,尤其是存在大量长模式的时候。文中改进了FP 树结构,提出了一种基于FP tree的快速挖掘最大频繁项目集的算法DMFIA 1,该算法不需要生成最大频繁候选项目集,比DMFIA算法挖掘最大频繁项目集的效率更高。改进的FP 树是单向的,每个结点只保留指向父结点的指针,这大约节省了三分之一的树空间。  相似文献   

9.
提出一种基于FP—tree的最大频繁项目挖掘算法DMFIA—D,该算法运用双向搜索策略。根据FP—tree构造特征自顶向下选取最大频繁候选项集,自底向上对候选项集进行计数、剪枝最终确定最大频繁项目集。由于减少了最大频繁候选集,并对候选集进行有效剪枝,从而缩短算法的挖掘时间,提高挖掘效率。  相似文献   

10.
最大频繁项目集挖掘是多种数据挖掘应用研究的一个重要方面,最大频繁项目集的快速挖掘算法研究是当前研究的热点。传统的最大频繁项目集挖掘算法要多遍扫描数据库并产生大量的候选项目集。为此,该文提出了基于F-矩阵的最大频繁项目集快速挖掘算法FMMFIBFM,FMMFIBFM采用FP-tree的存储结构,仅须扫描数据库两遍且不产生候选频繁项目集,有效地提高了频繁项目集的挖掘效率。实验结果表明,FMMFIBFM算法是有效可行的。  相似文献   

11.
提出了一种基于频繁模式矩阵FP-array的挖掘最大频繁项目集的算法.算法基本思想:①只扫描事务数据库一遍,把该数据库转换成一个矩阵FP-array,并且保留了所有事务数据库中项目间的关联信息,然后对该矩阵进行挖掘.②在FP-array中只存放逻辑型数据,节省了存储空间.③直接在FP-array上挖掘而不需要递归创建大量条件模式矩阵,挖掘过程采用逻辑运算,在效率上有独特的优势.通过实验验证了算法的有效性.  相似文献   

12.
基于后退式二进制搜索的RFID防碰撞算法的研究   总被引:1,自引:0,他引:1  
标签防碰撞技术是射频识别(RFID)系统中提高识别效率的关键技术。在对基本二进制搜索算法及其各种改进算法进行分析的基础上,提出一种基于后退式二进制搜索算法的改进算法IRBS。该算法引入标签状态计数器Rn来记录标签的状态。首先判定标签的反馈信息碰撞位,然后把最高冲突位作为标签分组的依据,联合利用前、后向搜索方法来减少标签的搜索范围。仿真结果表明,该算法能减少阅读器和标签之间的通信量,有效地提高标签的识别速度。  相似文献   

13.
在关联规则挖掘中,主要的问题是如何高效地产生频繁项集。对近年来一些基于十字链表的Apriori算法进行研究和分析,发现它们的候选频繁项集生成方法有很大的改进空间。提出一个基于十字链表的改进算法,优化候选频繁项集的生成方法,减少对事务数据库的扫描,大大提高了挖掘效率。  相似文献   

14.
挖掘关联规则是数据挖掘领域的一个重要研究方向,人们已经提出了许多用于发现数据库中关联规则的算法,但对关联规则的增量维护问题的研究较少.深入分析了增量更新情况,使用了目前较高效的最大频繁模式挖掘算法FP-Max,并对其进行改进.基本思想:①基于FP-树;②考虑了数据集中,数据增加情况下FP-树的更新;③对FP-Max算法进行改进来更新、维护已经挖掘出来的最大频繁模式.  相似文献   

15.
在XML频繁查询模式挖掘稠密数据集、长数据集中,为克服项目集挖掘过程中挖掘的项目过多、不利于结果利用等问题,提出基于频繁叶模式的最大频繁查询模式挖掘算法MFRSTMiner。该算法通过构造频繁模式扩展森林,在扩展森林的叶节点中挖掘出最大频繁子树。试验结果表明该算法能够有效地挖掘动态事务集的最大频繁查询模式。  相似文献   

16.
一种基于区间约束的折半查找算法   总被引:1,自引:0,他引:1  
针对变化范围很大而又相对稳定的查找对象,给出一种基于区间约束的折半查找算法。当后一个查找对象在前一个查找对象附近时,在最坏状态和平均状态下,该算法与标准的折半查找算法比较,其查找长度元旦显著减少,而且代价很小。此算法适合用于类似过程控制中的对低频信号的实时查有处理,并在国家级新产品WPJ-3微机频率事故记录装置和WQP-4微机频率继电器中得到了成功的应用。  相似文献   

17.
基于数组的Apriori算法的改进   总被引:11,自引:1,他引:11  
本文通过对基于数组的Apriori算法的改进,提高了算法对内存空间的利用效率.同时利用数据集删减技术,提高了算法效率。  相似文献   

18.
数据挖掘中关联规则的一种高效Apriori算法   总被引:21,自引:0,他引:21  
在数据挖掘中关联规则的频繁项集计算时,通过一种改进的Apriori算法,即用升序替代原来的按字母次序对项集进行排序,可大大精简候选频繁集,而且能保持频繁集的完整性,减少计算开销。  相似文献   

19.
为有效解决传统二进制搜索防碰撞算法吞吐率较低的问题,提出一种改进的二进制优化编码算法。新算法利用标签序列号的唯一性和曼彻斯特编码可以准确地识别标签碰撞位置的特性,将读写器发送的字符进行二进制优化编码,从而避免了大量空闲字符的发送,并缩短了单次所发送的字符的长度。仿真实验表明,二进制优化编码算法克服了传统防碰撞算法的缺点,尤其在标签数量较多的场合,可有效减少搜索次数和搜索所发送字符的长度,提高射频识别系统的吞吐率。  相似文献   

20.
该文在对关联规则挖掘中Apriori算法的深入研究和分析的基础上,发现并指出了该算法存在的不足,并对其进行以下三方面改进:改善候选项集支持度的计算方法;缩小候选项集的生成规模;减少对数据库的扫描次数。实验结果表明.改进算法性能得到了明显提高。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号