共查询到20条相似文献,搜索用时 46 毫秒
1.
提出基于因子项集的并行化策略GP以发挥串行算法的剪枝功效。其基本思想是利用因子项集的完全包含关系在处理机之间贪心分配等价类,根据等价类的需要相应地划分和复制数据库记录,使各处理机得以异步计算,达到较好的负载平衡、较高的剪枝效率和较少的数据库记录复制,缩短算法的执行时间。分析和实验表明,基于GP策略的并行算法有较好的可扩展性,其性能优于已有同类算法。 相似文献
2.
3.
利用了有向项集图来存储事务数据库中有关频繁项集的信息,提出了有向项集图的三叉链表式存储结构和基于有向项集图的频繁闭项集挖掘算法。不仅实现了事务数据库的一次扫描,减少了I/O代价,而且提高了数据结构的存储空间效率和频繁闭项集挖掘算法的执行时间效率。 相似文献
4.
在对逆向FP-tree的研究基础上提出了逆向索引FP-tree挖掘频繁项集的算法。该算法构造了逆向索引FP-tree,通过寻找扩展频繁项集与合并第一棵子树的方法挖掘频繁项集,给出了逆向索引FP-tree的性质和挖掘算法。 相似文献
5.
针对在交易数据库中挖掘出指定顾客相关属性的频繁项集这一问题,提出了基于维约束进行求解的构想.采用模式增长的挖掘方法,但与传统的模式树不同的是将原先每一节点频繁计数值设为在所有可能的谓词约束下该项的计数形成的向量,并利用HASH表进行向量值及项所在层的位置映射,因此,在不同的约束组合下的频繁项集挖掘将不再需要扫描数据库.仿真实验表明该挖掘算法的完备性,通过与先筛选再挖掘的算法进行比较,证明该挖掘算法具有更高的效率. 相似文献
6.
提出了一种高效挖掘数据的频繁项目集模式的算法FIA.该算法采用一种二进制符号来表示数据,在仅扫描数据库一次之后,建立起二进制向量与上三角频繁项集矩阵,根据两者来产生出频繁项集.从而有效地缩小了搜索空间,加快了处理速度.通过实验表明,FIA算法比Apriori算法更有效. 相似文献
7.
基于矩阵的最大频繁模式挖掘及其更新算法 总被引:1,自引:0,他引:1
提出了一种基于矩阵的挖掘最大频繁模式的算法(FPA),只需扫描数据集一遍,不生成候选项目集。在实际应用中用户经常需要调整最小支持度阀值获得信息,为此,提出了更新挖掘算法(UFPA)。实验结果表明,这两个算法具有很好性能。 相似文献
8.
频繁项集快速挖掘及更新算法 总被引:2,自引:0,他引:2
为了克服Apriori发现频繁项集存在的问题,提出了一种基于三维项集矩阵和向量(TIMV)的频繁项集挖掘算法.该算法摆脱了Apriori框架的束缚,仅需扫描数据库一次,不产生候选项目集.当事务数据库和最小支持度发生变化时,该算法只需重新遍历一次项集矩阵,即可得到新的频繁项集.实验结果表明,算法能有效提高频繁项目集的挖掘和更新效率. 相似文献
9.
提出一种基于极大完全子图的最大频繁项集并行挖掘算法PMFIM,通过遍历由频繁2-项集构成的用邻-接矩阵表示的图,寻找图的极大完全子图,从而由极大完全子图顶点序列实现对项集的划分,即挖掘子任务的划分.在同类算法中,将找到的最大频繁项划分为局部最大频繁项集LMFI、可能最大频繁项集PMFI和邻接项集的最大频繁项集的超集SMFI,减少了该类算法合并最大频繁项集的开销,并对算法进行了实现和优化. 相似文献
10.
本文提出了一种云环境下基于二进制编码的并行频繁项集挖掘算法,利用一种特殊的二进制编码的依赖度计量方法对原始数据集合进行编码转换及依赖度聚类,然后将数据集分布部署在云环境中,并采用共享多头表的FP-Growth并行改进算法挖掘频繁项集.实验表明,对于大规模数据集来说,本文算法可以取得良好的性能. 相似文献
11.
一种频繁项目集的快速挖掘算法 总被引:2,自引:2,他引:0
杨君锐 《微电子学与计算机》2004,21(2):70-72,77
关联规则是当前数据挖掘研究的主要领域之一,发现频繁项目集是关联规则数据挖掘中的关键问题。文章提出了一种快速挖掘频繁项目集的新方法FMFI(Fast Mining Frequent Itemsets)。针对关联规则下频繁项目集的特性,该算法摆脱了传统的自底向上的搜索策略,而采取了自底向上和自顶向下相结合的双向搜索方式,从而降低了扫描数据库的次数,提高了挖掘效率。 相似文献
12.
加权最大频繁项目集挖掘算法 总被引:2,自引:0,他引:2
关联规则是数据挖掘领域的一个重要分支,而发现最大频繁项目集是关联规则挖掘中的重要问题.最大频繁项目集挖掘是在数据库中各属性之间是平等的情况下进行的,但现实中并非如此.频繁模式树(Frequent Pattern Tree,FP-Tree)已不能满足要求.为此提出了一个有效的基于加权FP-Tree的加权最大频繁项目集挖掘算法,其挖掘过程中不需要产生候选项目集.并通过实例说明了此算法的挖掘过程.实验结果表明此算法是有效的并且有较好的扩展性. 相似文献
13.
提出了一种基于布尔矩阵的最大频繁项集挖掘算法,通过将FP-tree映射成布尔矩阵和权值表,运用布尔逻辑运算进行矩阵投影操作得到最大频繁项集,算法在挖掘过程中不用生成最大频繁候选项集,从而大大提高了算法的时间效率和空间可伸缩性。 相似文献
14.
《IEEE transactions on systems, man and cybernetics. Part C, Applications and reviews》2009,39(2):156-169
15.
发现最大频繁(项目)集是关联规则挖掘中的重要问题。提出一个基于频繁模式树FP—Tree(Frequent Pattern Tree)的快速发现最大频繁项目集算法MFP—growth(Maximum Frequent Pattern growth),其发现过程中不需要产生候选(项目)集,从而提高了挖掘效率。由实验结果表明,此算法在发现最大频繁项目集方面具有很好的性能。 相似文献
16.
随着数据量的增长,隐私保护的问题也愈发突出,文中是介绍了目前数据挖掘过程中隐私保护相关的基本技术,提出了一种数据集中式分布下布尔数据集的关联规则的挖掘算法,此方法在实现了隐私保护的同时,通过与或运算实现了数据集的压缩。相关实验数据表明,该算法有效减少了挖掘时间,并保证了误差在可接受的范围之内。 相似文献
17.
提出了一种进行图像关联规则提取时产生频繁项集的方法——频繁项树.为便于频繁项树的运用,使用了bSQ的图像数据格式来重新组织图像数据,并在此基础上提出了频繁项树的截断、半深度优先、图像掩模和多层次灰度范围自动生成等优化技术,降低了算法的时间和空间复杂度,使其具有较高的运行效率和实用价值. 相似文献
18.
为了挖掘医药销售数据库频繁集,采用双数组穷举算法DAEA。该算法主要使用两个数组和穷举算法,实现挖掘医药销售数据库的频繁集功能。该算法的优点是只需对医药销售数据库进行数据预处理就可以直接挖掘该数据库的频繁集,无需把医药销售数据库转换成相应的事务数据库。根据DAEA算法,开发了医药销售数据库频繁集挖掘系统,使用该系统挖掘医药销售数据库的频繁集,挖掘的结果与实际相吻合,说明该算法是可行的和有效的。 相似文献
19.
Wireless Personal Communications - The replica strategy in traditional distributed file system, which creates a copy mainly from the perspective of internal resources while changes in external... 相似文献
20.
针对大型数据库挖掘中需要多次访问数据库和效率较低的局限性,提出一次性数据库访问策略,设计了基于Apriori的Apriori_ADO算法.经过实验分析,Apriori_ADO算法降低了算法的时间和空间开销,提高了关联规则挖掘效率.算法具有很强的实用性,已用于超市中顾客消费知识的挖掘,并取得了满意的结果. 相似文献