首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
吴恒山  段雄文  李晨阳 《计算机应用》2005,25(11):2624-2626
针对一类常见而简单的规则中有项或缺项的约束,提出了一种基于事务数据修剪的约束关联规则的快速挖掘算法。该算法先扫描一遍数据库对事务进行水平和纵向的修剪,接着在修剪后的数据集上挖掘频繁项集,形成规则的候选头集、体集和规则项集,最后一次扫描后由最小可信度约束得到所要求的关联规则。实验表明,与按简洁约束采取的一般策略相比,该算法的性能有较明显的提高。设计了一套新的叶子结点编码方式,基于该编码,实现了编码四叉树的邻域寻找。此方法减少了四叉树存储的结点个数,提高了存储效率。同时由于在叶子一级采用位操作实现邻域寻找,使查询效率有所提高。  相似文献   

2.
关联规则挖掘是数据挖掘研究领域中的一个重要任务,旨在挖掘事务数据库中有趣的关联。Apriori算法是关联规则挖掘中的经典算法。然而Apriori算法存在着产生候选项目集效率低和频繁扫描数据等缺点。提出了一种新的Apriori的改进算法,该算法在生成k(k>1)项频繁集时,不需要重新扫描数据库,只是在生成1项频集时,才需要扫描事务数据库,有效地减少了对事务数据库的读操作,在时间复杂度上较经典的Apriori算法有更加优越的性能。  相似文献   

3.
杨泽民 《计算机科学》2013,40(3):259-262
为了解决关联规则挖掘算法中频繁集信息挖掘不完善和时序周期对事务集频繁项挖掘的影响问题,提出了一种基于时序和兴趣度约束的加权关系规则挖掘算法。该算法首先利用时序滑动函数对时序事务集进行发生概率估算和权值赋值,依据兴趣度约束函数和剪枝定理进行事务集化简,然后根据支持度和寿支持期望进行加权频繁事务集抽取,最后依据置信度进行加权关联规则导出。实验结果证明,该算法能够快速有效地挖掘出符合用户兴趣度的关联规则。  相似文献   

4.
为解决在挖掘关联规则时存在大量冗余规则以及效率不高的问题,提出了一种基于事务ID集合的带约束的关联规则挖掘算法ACARMT.该算法结合了Separate算法以及基于数据垂直分布算法的优势,先根据约束条件产生基础频繁项目集,再利用事务ID集合存储项目集信息,从而避免重复扫描数据库,提高了挖掘效率.应用该算法挖掘实际的生殖健康数据的实验表明,在数据量大到超出基于数据垂直分布算法的使用范围时,该算法仍然有效,并且其效率优于Separate算法.  相似文献   

5.
对关联规则和约束关联规则的算法进行了研究和分析,基于候选集的约束算法需要反复扫描数据库,并产生大量的候选集,在挖掘低支持度、长模式的规则时效率低下。针对算法的缺陷,该文提出了一种Conf-H-Mine算法,采用Conf-H-Struct结构存储事务集合,不产生候选集,优化了关联规则的挖掘。实验结果证明了该算法的有效性。  相似文献   

6.
针对Apriori算法的缺陷,引入一种新结构—链表数组来压缩存放数据的相关信息,并结合修剪频繁集和连接优化策略,得到一种新的关联规则挖掘算法FAA算法。该算法只须扫描两遍数据库,优化了连接操作,提高了候选项集的支持事务计数的效率,减少了候选项集的数目,较好地提高了算法的效率。实验结果表明FAA算法是可行有效的。  相似文献   

7.
时态关联规则挖掘是针对在一段时间范围内的关联挖掘,在现实中有较多的应用。现有的大多数时态关联挖掘算法或者需要多次扫描数据库,或者没有考虑各个项在数据集上出现或结束时间上的不同,因而挖掘性能受到较大的制约。为此,本文提出一种增量式的面向具有不同时间出现与结束的项的时态关联规则挖掘算法。为减少存储方面的开销,只需保存已挖掘过的历史数据集中的频繁1项集。为了减少数据的扫描量,通过有效的剪枝策略,有选择性地扫描相关事务项,至多只需扫描一次完整的数据库。实验证明,该算法具有较好的挖掘性能。  相似文献   

8.
一种事务互补挖掘算法的研究及应用   总被引:5,自引:3,他引:2  
提出一种事务互补的挖掘算法,其适合挖掘任何长度的频繁项目集。该算法用事务互补搜索策略产生候选项,使用频繁项目集修剪其子集和非频繁项目集修剪其超集策略减少候选项;在计算支持数时使用了二进制的逻辑运算和事务特性,提高了算法的效率。将其应用到横向空间关联规则挖掘中,实验表明该算法是快速而有效的。  相似文献   

9.
关联规则挖掘过程中,为了得到侯选项集的支持度,需要将候选项集与数据库中事务逐一进行比较,影响了算法的执行效率.针对该问题,提出一种基于数据立方体的关联规则挖掘算法ABDC.该算法结合了属性分组的思想,将生成的侯选项集进行编码后,利用数据库中事务的包含关系,在数据立方体中迅速查找到包含该侯选项集的所有事务在数据库中的出现频率,依次累加后根据最小支持量得到数据库中存在的频繁项集,不仅对事务数量的递增具有不敏感性,而且提高了算法的执行效率.实验结果表明,该算法对挖掘大量事务集中存在的关联规则是快速有效的.  相似文献   

10.
基于Apriori算法的改进算法   总被引:2,自引:0,他引:2  
关联规则挖掘是数据挖掘研究的一项重要内容.为了快速挖掘关联规则,分析了挖掘关联规则的Apriori算法,并在此基础上给出了一种改进的算法:NApriori算法,利用频繁1项集重新组织事务数据库来挖掘关联规则,此方法仅需扫描数据库2次,且避免了Apriori算法繁琐的连接和删除步骤,实验结果表明此方法比Apriori算法有更好的性能.  相似文献   

11.
频繁模式挖掘算法FP-growth算法需递归地生成大量的条件FP-树,且耗费大量存储空间和时间。为此,采用矩阵技术统计约束子树中的频繁项集和频繁项集的支持度,以进行数据挖掘。实验结果表明,该频繁模式挖掘算法是有效的,具有较高的时间效率及空间 效率。  相似文献   

12.
针对贴片机的数据挖掘课题中,关联规则生成规则数较多而不易于分析的问题,研究了单决策属性作为规则后件的方法,对实际应用中存在条件约束的情况进行了分析,提出了基于决策属性的关联规则挖掘优化算法。应用结果表明这样得到的规则简洁明确,规则具有实用价值,并且频繁集优化的效果显著,达到了快速挖掘的目的。  相似文献   

13.
胡鹏  童恒建  徐来 《微计算机信息》2006,22(15):175-177
数据挖掘的目的是为了发现有效的关联规则从而找到不易发现的规律从而对企业的决策提供帮助,而查找频繁项集是发现有效关联规则的基础,其基础算法是Apriori算法。分布式数据库是目前较为流行的一种的数据库开发模式,它通过将一套完整的数据库系统分别部署在几台电脑上可以实现几台电脑并行处理数据从而提高数据库的效率。本文通过分析一个查找频繁项集的例子提出了一种将改进的频繁项集查找算法与分布式数据库相结合的方法从而实现频繁项集的高效查找。  相似文献   

14.
宫雨 《计算机工程》2007,33(5):29-31
针对具有上界约束的关联规则问题进行了研究,给出了上界约束的定义,分析了满足上界约束频繁集的性质,并给出了相关的证明。在此基础上,提出了基于FP-Tree的上界约束算法,采用了预先测试的方法,降低了测试项集的成本,提高了计算效率,实验结果证明该算法具有较高的效率。  相似文献   

15.
数据挖掘是从数据库中发现潜在有用知识或者感兴趣模式的过程。在数据挖掘领域中主要集中于单一支持度下的关联规则挖掘,在事务数据库中发现项目之间的关联性,而在实际应用中,项目可以有不同的最小支持度,不同的项目可能具有不同的标准去判断其重要性,因此提出一个在最大值支持度约束下,发现有用的模糊关联规则挖掘算法,在该约束下,利用逐层搜索的迭代方法发现频繁项目集,通过实例证明了该挖掘算法是易于理解和有意义的,具有很好的效率。  相似文献   

16.
在关联规则挖掘算法中,Apriori由于多次对数据库进行扫描会产生较多的候选集,在多次扫描数据库的情况下容易产生I/O开销问题,并引起数据挖掘效率低.矩阵关联规则在数据挖掘过程中没有删除非频繁项集,致使存在较多的无效扫描,对于挖掘效率的提高也不明显.该文提出了一种改进的矩阵和排序索引关联规则数据挖掘算法,首先,删除不需...  相似文献   

17.
一种快速挖掘约束性关联规则的算法   总被引:2,自引:0,他引:2  
方刚 《计算机应用与软件》2009,26(8):268-270,280
提出一种快速挖掘约束性关联规则的算法,其适用于挖掘带约束条件的频繁项目集.该算法通过数字区间的数值自动递减产生候选频繁项,并用二进制的逻辑操作计算支持数和用数字特征减少扫描事务的个数.算法的原理简单有效,能够有效减少扫描的时间和产生候选频繁项的时间,与现有的约束性关联规则挖掘算法和基于二进制的挖掘算法相比,其效率得到明显提高.  相似文献   

18.
王明  宋顺林 《计算机应用》2010,30(9):2332-2334
发现频繁项集是关联规则挖掘的主要途径,也是关联规则挖掘算法研究的重点。关联规则挖掘的经典Apriori算法及其改进算法大致可以归为基于SQL和基于内存两类。为了提高挖掘效率,在仔细分析了基于内存算法存在效率瓶颈的基础上,提出了一种发现频繁项集的改进算法。该算法使用了一种快速产生和验证候选项集的方法,提高了生成项目集的速度。实验结果显示该算法能有效提高挖掘效率。  相似文献   

19.
挖掘频繁项集是许多数据挖掘任务中的关键问题,也是关联规则挖掘算法的核心,提高频繁项集的生成效率一直是近几年数据挖掘领域研究的热点之一.在对关联规则挖 掘中基于Apriori算法的改进算法进行深入分析和研究后,本文根据Apriori算法的不足,提出了一种改进策略,从而得到一种优化的Apriori算法.最后,对频繁项集挖掘算法的发展方向进行了初步的探讨.  相似文献   

20.
关联规则挖掘Apriori算法的改进与实现   总被引:11,自引:2,他引:11  
陈文庆  许棠 《微机发展》2005,15(8):155-157
Apriori算法是关联规则挖掘的一个经典算法,提高Apriori算法关联规则挖掘效率的关键是减少候选集的数量。通过分析、研究该算法的基本思想,文中提出利用Hash表存储技术对该算法进行改进,通过删除项Hash表来减少生成候选集的数量,从而提高算法的效率。实验结果表明,该改进算法能有效地提高关联规则挖掘的效率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号