首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
基于索引数组的频繁项集挖掘算法*   总被引:2,自引:0,他引:2  
基于现有的关联规则挖掘算法,提出了一种通过循环迭代增加项为项集后缀的方式产生所有项集的新方法,构造了一种新的数据结构—索引数组,存储所发现的频繁1-项集及其相关信息,以便快速发现项集与事务之间的关系;并提出了一种基于索引数组的频繁项集挖掘新算法。该算法只需扫描数据库两次就能发现所有频繁项集。实验结果表明,该算法可以有效提高频繁项集的挖掘效率。  相似文献   

2.
关联规则挖掘是数据挖掘中的一个重要研究内容.为了高效、快速地从事务数据库中挖掘出频繁项集,针对数据挖掘的经典关联规则Apriori算法的瓶颈问题提出了改进的方法.算法将事物数据库映射到布尔型数组中,然后所有的操作都针对数组元素值展开.这样大大减少了数据库的扫描次数.算法利用数组的随机访问特性及布尔型数据的简单"与"操作,直接产生频繁项集,而不产生大量的候选项集.经理论分析和实验结果显示该算法在效率上明显优于Apriori 算法.  相似文献   

3.
挖掘频繁项集是关联规则算法中的关键问题,提高频繁项集的产生效率是近几年关联规则挖掘领域研究热点之一。该文针对Apriori算法的不足,提出了一种0-1矩阵的改进算法。此改进算法大大减少了访问数据库的次数,提高了系统的运行效率,同时还减少了大量的候选集的产生,节约了存储空间。  相似文献   

4.
基于频繁项集挖掘算法的改进与研究   总被引:2,自引:1,他引:1  
关联规则挖掘是数据挖掘领域中重要的研究内容,频繁项集挖掘又是关联规则挖掘中的关键问题之一。针对已有的频繁项集挖掘算法存在的问题,通过对Apriori算法的分析,提出了Inter-Apriori频繁项集挖掘算法。该算法使用交集策略减少扫描数据库的次数,从而使算法达到较高的效率。实验结果表明,Inter-Apriori算法是Apriori算法效率的2~4倍。  相似文献   

5.
基于数组的关联规则挖掘算法   总被引:4,自引:1,他引:3  
文章提出了基于数组的关联规则挖掘算法,只需要扫描数据库1次,利用数组的结构特性来提高挖掘效率。  相似文献   

6.
基于消费行为的Apriori算法研究   总被引:2,自引:1,他引:2  
介绍了关联规则的数据挖掘,对布尔关联规则中的经典算法-Apriori算法进行了分析和评价,指出了基本Apriori算法的不足,并提出具有广泛适应性的改进算法,此算法既提高在扫描数据库过程中的信息区率,又及时剔除超集不是频繁项集的项集,进一步缩减项集的潜在规模,提高了频繁项集生成的效率。  相似文献   

7.
提出了一种挖掘量化关联规则的MQAR算法。此算法在挖掘关联规则时,只需扫描事务数据库一遍,提高了数据挖掘的效率;并且存放辅助信息所占的内存空间大大少于现有的挖掘算法;同时此算法不仅能挖掘出有关联的数据项集,还能找出这些项集之间数量上的相互关系。  相似文献   

8.
一种改进的正负关联规则挖掘算法   总被引:1,自引:0,他引:1  
陈宁军  高志年 《计算机科学》2011,38(12):191-193,212
针对传统正负关联规则挖掘算法需要多次扫描数据库并且生成大量候选频繁项集的问题,在对比目前相关研究成果的基础上,提出了一种改进的正负关联规则挖掘算法,它通过两次数据扫描完成对正负关联规则的挖掘,对最大频繁项集的挖掘算法做了改进,有效提高了算法效率,同时对置信度标准做了改进。基于某真实事务集的实验表明,算法提高了规则挖掘的质量和有效性。  相似文献   

9.
提出了一种基于聚类的挖掘关联规则Apriori改进算法,该算法只需扫描一次事务数据库,直接按事务项数生成聚类表,每次只需扫描部分聚类表就可生成频繁项集,减少了扫描数据库的次数和计算成本,从而有效提高挖掘关联规则的效率。  相似文献   

10.
快速关联规则挖掘算法   总被引:13,自引:2,他引:13  
关联规则挖掘是数据挖掘及知识发现领域的重要研究内容之一,其核心任务是挖掘数据库中的频繁项集。Apriori及其改良算法是频繁项集挖掘的有效算法。在类Apriori的算法中,它们都采用哈希树来存储频繁项集的候补项集以便快速计算其支持度。该文在仔细分析这些算法所存在的效率瓶颈的基础上,提出了另一个有效的改进算法。所提算法通过利用一个一维数组替代已有算法中的复杂的哈希树来达到改善它们效率瓶颈的目的。通过多个实验评估,该文所提算法的挖掘效率很高,比Apriori及其改良算法要快2到5倍。  相似文献   

11.
桂现才  彭宏 《微机发展》2005,15(10):35-38
在大型数据库项目之间发现关联规则是一个重要的数据挖掘问题,而挖掘出的关联规则数目常常是巨大的。文中介绍了简单关联规则和原关联规则的概念,而传统算法挖掘出的关联规则集中的任何规则,均可以由原关联规则导出,并且原关联规则的数目远远小于传统算法挖掘出的关联规则数目。对简单关联规则和原关联规则进行了分析比较,给出了挖掘原关联规则算法,并举例说明算法的执行过程。  相似文献   

12.
通过对关联规则挖掘技术及经典算法Apriori和FP-growth的研究和分析,提出了一种改进的频繁项集挖掘算法。该算法利用矩阵存储数据,并结合矩阵运算求项集的支持数,有效减少了事务数据库的扫描次数;利用有序频繁项目邻接矩阵创建频繁模式树,有效减少了频繁模式树的分支和层数。通过实例分析了频繁项集的挖掘过程。  相似文献   

13.
为了挖掘集合值关系数据库的模糊关联规则,应用竞争聚集算法将记录在数量型属性上的取值划分成若干个模糊集,接着给出集合值关系数据库上数量型属的模糊关联规则的挖掘算法,此算法能将数量型属性模糊关联规则的挖掘问题转化为布尔属性关联规则的挖掘问题。最后通过一个实例说明挖掘算法的合理性。  相似文献   

14.
A concept lattice is an ordered structure between concepts. It is particularly effective in mining association rules. However, a concept lattice is not efficient for large databases because the lattice size increases with the number of transactions. Finding an efficient strategy for dynamically updating the lattice is an important issue for real-world applications, where new transactions are constantly inserted into databases. To build an efficient storage structure for mining association rules, this study proposes a method for building the initial frequent closed itemset lattice from the original database. The lattice is updated when new transactions are inserted. The number of database rescans over the entire database is reduced in the maintenance process. The proposed algorithm is compared with building a lattice in batch mode to demonstrate the effectiveness of the proposed algorithm.  相似文献   

15.
关联规则挖掘是数据挖掘领域中最活跃的一个分支。目前提出的许多关联规则挖掘算法需要多次扫描数据库并产生大量候选项集,影响了挖掘效率。针对加权关联规则挖掘算法中多次扫描数据库影响算法性能的问题,对其进行了优化,采取了以空间换时间的思路,提出一种基于向量的概率加权关联规则挖掘算法。以求概率的方式设置项目属性的权值,通过矩阵向量存储结构保存事务记录,只需扫描一次数据库,并且采用不同的剪枝策略及加权支持度和置信度的计算方式。使用数据实例进行模拟实验,结果表明此算法明显提高了挖掘效率。  相似文献   

16.
Shared-nothing并行事务数据库系统中规则的挖掘与更新算法   总被引:1,自引:0,他引:1  
关联规则是数据挖掘中的一个重要研究内容.本文提出了Shared—nothing并行事务数据库系统(简称SNPDBS)中一种快速的关联规则挖掘算法SNPMAR,并考虑当最小支持度发生变化后SNPDBS中关联规则的高效更新问题,提出了一种有效的关联规则更新算法SNPIUA.  相似文献   

17.
数据挖掘中的关联分析技术旨在发现大量数据项集之间有趣的关联关系,其核心问题是寻找频繁项集。针对传统的基于矩阵的关联挖掘算法中矩阵规模和事务数据库大小相关,在处理超大型事务数据库时,仍会存在内存瓶颈的问题,提出了一个矩阵规模和事务数据库大小无关、通过矩阵约束预挖掘后验证的频繁项集发现算法。实验结果显示,该算法提高了频繁项集的挖掘速度。  相似文献   

18.
对关联规则的挖掘是数据挖掘中一个重要的问题 .通过挖掘 free项目集来挖掘关联规则已被证明是一种十分高效的方法 .Seg Free算法将数据库分成许多分段并在这些分段中查找 free项目集 .它只耗用很小的额外内存来存储在每个分段中项目集的支持度 ,却能极大的减少项目集匹配的时间 ,而项目集匹配的时间是整个挖掘过程的瓶颈 .在真实数据集上的试验已显示了它良好的性能 .它还能使用在其他的数据挖掘任务中  相似文献   

19.
根据素数只有两个约数的性质,论文提出了一种基于素数存储的关联规则算法。该算法成功地把事务库转化为一个一维数值型的事务库。其中每个事务转化为某些互不相等的素数乘积的形式。在项集比较方面,转化为求约数的数值运算。因此,统计数据项频次成为统计事务公约数的问题。这种通过素数存储和求公约数的方法,提高了关联规则挖掘的性能,实际效果也比较理想。  相似文献   

20.
一种基于MFP树的快速关联规则挖掘算法   总被引:1,自引:0,他引:1  
在关联规则挖掘FP-Growth算法的基础上,提出一种基于MFP树的快速关联规则挖掘算法。文中给出了MFP算法的工作原理。MFP算法能在一次扫描事务数据库的过程中,把该数据库转换成MFP树,然后对MFP树进行关联规则挖掘。MFP算法比FP-Growth算法减少一次对事务数据的扫描,因此具有较高的时间效率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号