共查询到18条相似文献,搜索用时 125 毫秒
1.
一种快速挖掘约束性关联规则的算法 总被引:2,自引:0,他引:2
方刚 《计算机应用与软件》2009,26(8):268-270,280
提出一种快速挖掘约束性关联规则的算法,其适用于挖掘带约束条件的频繁项目集.该算法通过数字区间的数值自动递减产生候选频繁项,并用二进制的逻辑操作计算支持数和用数字特征减少扫描事务的个数.算法的原理简单有效,能够有效减少扫描的时间和产生候选频繁项的时间,与现有的约束性关联规则挖掘算法和基于二进制的挖掘算法相比,其效率得到明显提高. 相似文献
2.
为了易于产生候选频繁项目集和计算项目集的支持数,提出了基于二进制的关联规则挖掘算法,但在搜索候选频繁项目集时仍从集合论出发,沿用传统搜索超集或子集的方法,在一定程度上效率受到了限制;为此提出了一种基于二进制的交叉挖掘关联规则算法,通过数值的递增和递减交叉方式自动产生候选频繁项集,缩短了候选频繁项的搜索空间,并在计算支持数时通过数字特征减少了扫描事务的个数,算法的效率得到了明显提高;该实验结果表明:与现有的二进制关联规则挖掘算法相比,算法是快速而有效的。 相似文献
3.
在基于空间事务的横向关联规则挖掘中,为了能够在海量数据中有效地提取空间拓扑关联规则,提出一种挖掘空间拓扑关联的有效算法,其适合挖掘多层横向空间关联规则.该算法用二进制数存储空间拓扑关系,使空间事务和数字建立对应关系,用数字递增的方法产生候选频繁项.在计算支持数时,算法在用逻辑运算的同时还利用数字特性减少扫描的空间事务数,大大地提高了效率.实验结果表明,在提取多层空间拓扑关联规则时,其比现有的算法更快速更有效. 相似文献
4.
分布式环境下约束性关联规则的快速挖掘 总被引:2,自引:0,他引:2
研究人员针对单机环境提出了约束性关联规则的挖掘算法,但它们不适用于分布式环境.为此本文讨论分布式环境下约束性关联规则的快速挖掘技术,提出一种基于分布式环境的约束性关联规则快速挖掘算法DCAR,其中包括局部约束性频繁项目集挖掘算法MLFC和全局约束性频繁项目集挖掘算法MGFC.该算法根据布尔约束条件产生向导集,采用一种新的候选项集生成函数Reorder-gen,该函数通过向导集高效地产生分布式环境中满足约束条件的、数量较少且完备的候选项集,并且求解全局约束性频繁项集过程中,传送局部候选项集支持数的通信量为O(n),从而提高了算法的挖掘效率.将本文提出的算法加以实现,实验结果表明DCAR算法高效可行,其效率大约是DMA-IC算法的2-3倍. 相似文献
5.
二进制挖掘算法在空间数据挖掘中的应用 总被引:1,自引:0,他引:1
现有的传统关联规则挖掘算法构建频繁候选项的方式和修剪技术是其应用于空间数据挖掘的技术难题.针对空间数据挖掘中数据库的属性特点,将基于二进制的挖掘算法应用于空闻数据挖掘中.该算法用二进制的逻辑运算产生频繁候选项和计算支持数,有效地解决了现有挖掘算法在空间数据库中提取关联规则时存在的难题. 相似文献
6.
基于二进制的长频繁项空间数据挖掘算法 总被引:4,自引:0,他引:4
提出一种基于二进制的空间关联规则挖掘算法,它适合挖掘长频繁项目集和同一空间关系模式下不同对象之间的关联。算法从搜索策略、修剪策略和存储结构三个方面改进了现有的二进制关联规则挖掘算法,并用数字特征来减少被扫描事务的个数,减少了算法的执行时间;将其用在单一的空间数据挖掘中效率得到了明显提高。 相似文献
7.
为了减少移动计算中提取空间关系的计算代价,提出一种基于二进制的关联规则挖掘算法,适合于在移动计算中提取包含多个空间对象的关联.该算法采用自顶向下的搜索策略,利用二进制的逻辑运算产生频繁候选项和计算频繁候选项的支持数,大大地提高了算法的效率.该算法能够有效地用在移动计算中提高系统对用户的响应速度,特别是在挖掘长空间关联规则时,实验结果表明,该算法比现有算法更快速而有效. 相似文献
8.
针对现有挖掘算法不能快速地提取空间拓扑关联,提出一种空间拓扑关联的双向挖掘算法,其适合在海量空间数据中挖掘空间拓扑关联规则;该算法用二进制数表示空间拓扑元,并用其位运算,按自顶向下和自底向上两种方式计算产生候选频繁项,实现双向搜索空间拓扑关联规则;算法在计算支持数时还用数字式空间事务的特性减少被扫描的事务数,达到提高挖掘效率的目的。实验结果表明在空间数据中挖掘空间拓扑关联规则时,该算法比现有算法更快速更有效。 相似文献
9.
在提取满足用户特定需求的关联规则时,由于现有约束性关联规则挖掘算法存在大量的冗余候选项和重复计算,故提出一种基于属性位复用的约束性关联规则挖掘算法,其适合挖掘任何长度且满足用户特定需求的关联规则。该算法通过属性位的权值组合,将交易事务转换成整数,用属性位复用技术构建候选区间,并利用其端点值双向变化,构建索引候选频繁项,同时也用布尔运算计算其支持数。实验证明其比现有算法更快速,将其应用到客户关系管理系统中分析客户关联信息,可以有效地提高系统效率。 相似文献
10.
11.
分布式系统下关联规则挖掘算法的挖掘效率取决于频繁项目集的确定和网络各站点间的通讯量。为提高频繁项目集的生成效率,提出了关系数据库下一种新的数据预处理方法以及一种基于数组形式的频繁项目集生成算法。新的数据预处理方法可以降低候选项目集的数量,基于二进制的数组只需进行逻辑与运算便可生成频繁项目集,将该算法结合星型网络结构下的分布式挖掘算法SDMA应用于实验挖掘,理论分析与实验结果表明,算法提高了挖掘效率,是可行的。 相似文献
12.
Chowdhury Farhan Ahmed Syed Khairuzzaman Tanbeer Byeong-Soo Jeong Young-Koo Lee 《Applied Intelligence》2011,34(2):181-198
Traditional frequent pattern mining methods consider an equal profit/weight for all items and only binary occurrences (0/1)
of the items in transactions. High utility pattern mining becomes a very important research issue in data mining by considering
the non-binary frequency values of items in transactions and different profit values for each item. However, most of the existing
high utility pattern mining algorithms suffer in the level-wise candidate generation-and-test problem and generate too many
candidate patterns. Moreover, they need several database scans which are directly dependent on the maximum candidate length.
In this paper, we present a novel tree-based candidate pruning technique, called HUC-Prune (High Utility Candidates Prune),
to solve these problems. Our technique uses a novel tree structure, called HUC-tree (High Utility Candidates tree), to capture
important utility information of the candidate patterns. HUC-Prune avoids the level-wise candidate generation process by adopting
a pattern growth approach. In contrast to the existing algorithms, its number of database scans is completely independent
of the maximum candidate length. Extensive experimental results show that our algorithm is very efficient for high utility
pattern mining and it outperforms the existing algorithms. 相似文献
13.
最大频繁项目集的快速更新 总被引:29,自引:0,他引:29
挖掘最大频繁项目集是多种数据挖掘应用中的关键问题.为克服基于Apriori的最大频繁项目集挖掘算法存在的不足,DMFIA采用FP-tree存储结构及自顶向下的搜索策略,有效地提高了最大频繁项目集的挖掘效率.但对于频繁项目多而最大频繁项目集维数相对较小的情况,DMFIA要经过多层搜索且在每一层产生大量的候选项目集,因而影响算法的执行效率.为此,该文提出了DMFIA的改进算法IDMFIA(the Improved algorithm of DMFIA).IDMFIA采用自顶向下和自底向上双向搜索策略,可尽早修剪掉较短最大频繁项目集的超集和较长最大频繁项目集的子集.另外,该文还提出最大频繁项目集更新算法FUMFIA(Fast Updating Maximum Frequent Itemsets Algorithm),该算法充分利用已建立的FP-tree和已挖掘的最大频繁项目集,可对已挖掘的最大频繁项目集进行高效维护.实验结果表明,IDMFIA和FUMFIA可有效提高最大频繁项目集的挖掘和更新效率. 相似文献
14.
15.
16.
17.
使用垂直数据格式挖掘频繁项集 总被引:4,自引:0,他引:4
关联规则是数据挖掘的主要技术之一,它是描述数据库中一组数据项之间的某种潜在关系的规则。关联规则挖掘算法——Apriori算法,主要过程是对频繁项集的挖掘,而在对频繁项集的挖掘中首先要生成候选频繁项集,然后再从候选集中确定出满足最小支持度计数的频繁项集,这会耗费大量的CPU开销。使用垂直数据格式挖掘频繁项集可避免候选项目集的求解。 相似文献
18.
针对数据库中删除数据时如何有效地更新关联规则的问题,提出了UARAD算法。该算法可以有效利用知识数据库中保留的最小非高频项目集来产生新的候选项目集,避免了候选项目集的数量太庞大的问题。 相似文献