共查询到16条相似文献,搜索用时 140 毫秒
1.
提出一种基于二进制的约束性关联规则挖掘算法,用数字区间确定候选频繁项的范围,通过数值的递增/减方式交叉产生候选项,利用二进制的逻辑操作计算支持数,并用数字特征减少扫描事务数,以提取满足约束条件的关联规则。该算法适于挖掘任何长度的约束性频繁项目集,且具有较高的运算效率。 相似文献
2.
为了易于产生候选频繁项目集和计算项目集的支持数,提出了基于二进制的关联规则挖掘算法,但在搜索候选频繁项目集时仍从集合论出发,沿用传统搜索超集或子集的方法,在一定程度上效率受到了限制;为此提出了一种基于二进制的交叉挖掘关联规则算法,通过数值的递增和递减交叉方式自动产生候选频繁项集,缩短了候选频繁项的搜索空间,并在计算支持数时通过数字特征减少了扫描事务的个数,算法的效率得到了明显提高;该实验结果表明:与现有的二进制关联规则挖掘算法相比,算法是快速而有效的。 相似文献
3.
在基于空间事务的横向关联规则挖掘中,为了能够在海量数据中有效地提取空间拓扑关联规则,提出一种挖掘空间拓扑关联的有效算法,其适合挖掘多层横向空间关联规则.该算法用二进制数存储空间拓扑关系,使空间事务和数字建立对应关系,用数字递增的方法产生候选频繁项.在计算支持数时,算法在用逻辑运算的同时还利用数字特性减少扫描的空间事务数,大大地提高了效率.实验结果表明,在提取多层空间拓扑关联规则时,其比现有的算法更快速更有效. 相似文献
4.
分布式环境下约束性关联规则的快速挖掘 总被引:2,自引:0,他引:2
研究人员针对单机环境提出了约束性关联规则的挖掘算法,但它们不适用于分布式环境.为此本文讨论分布式环境下约束性关联规则的快速挖掘技术,提出一种基于分布式环境的约束性关联规则快速挖掘算法DCAR,其中包括局部约束性频繁项目集挖掘算法MLFC和全局约束性频繁项目集挖掘算法MGFC.该算法根据布尔约束条件产生向导集,采用一种新的候选项集生成函数Reorder-gen,该函数通过向导集高效地产生分布式环境中满足约束条件的、数量较少且完备的候选项集,并且求解全局约束性频繁项集过程中,传送局部候选项集支持数的通信量为O(n),从而提高了算法的挖掘效率.将本文提出的算法加以实现,实验结果表明DCAR算法高效可行,其效率大约是DMA-IC算法的2-3倍. 相似文献
5.
6.
针对现有挖掘算法不能快速地提取空间拓扑关联,提出一种空间拓扑关联的双向挖掘算法,其适合在海量空间数据中挖掘空间拓扑关联规则;该算法用二进制数表示空间拓扑元,并用其位运算,按自顶向下和自底向上两种方式计算产生候选频繁项,实现双向搜索空间拓扑关联规则;算法在计算支持数时还用数字式空间事务的特性减少被扫描的事务数,达到提高挖掘效率的目的。实验结果表明在空间数据中挖掘空间拓扑关联规则时,该算法比现有算法更快速更有效。 相似文献
7.
关联规则挖掘算法Apriori算法在挖掘频繁模式时需要产生大量的候选项集,多次扫描数据库,时空复杂度过高.针对该算法的局限性,提出了一种通过对项编码来减少扫描数据库次数并通过删除项来减少候选项集的数量,从而提高算法的效率.相同条件下的实验结果表明,优化后的算法能有效地提高关联规则挖掘的效率. 相似文献
8.
发现频繁项集是关联规则挖掘中最基本、最重要的问题.提出了一种基于二进制表示的频繁项集挖掘算法,并利用二进制的性质快速产生候选项集并计算其支持度.算法总体性能在一定程度上得到了提高. 相似文献
9.
针对现有基于空间事务的挖掘算法不能有效地提取空间拓扑关联,提出一种空间拓扑关联规则挖掘算法,其适合在空间关联横向挖掘中搜索拓扑关联;该算法将空间拓扑关系转换为整数,用整数递减的方法构建候选频繁项;算法用数字运算获取支持数,同时还用数字特性减少被扫描的空间事务数。在挖掘空间拓扑关联规则时,实验证明它是快速而有效的。 相似文献
10.
基于二进制的长频繁项空间数据挖掘算法 总被引:4,自引:0,他引:4
提出一种基于二进制的空间关联规则挖掘算法,它适合挖掘长频繁项目集和同一空间关系模式下不同对象之间的关联。算法从搜索策略、修剪策略和存储结构三个方面改进了现有的二进制关联规则挖掘算法,并用数字特征来减少被扫描事务的个数,减少了算法的执行时间;将其用在单一的空间数据挖掘中效率得到了明显提高。 相似文献
11.
加权关联规则的改进算法 总被引:7,自引:2,他引:7
论文讨论了加权关联规则问题,针对布尔类型的加权关联规则问题提出一种改进算法。该算法首先利用普通的关联规则算法产生频繁集,然后在该频繁集的基础上产生加权频繁集。同时,给出了最优的最小支持度设定方法,保证了普通关联规则算法所产生的频繁集为加权频繁集的超集。该算法有较高的效率,并且能够有效利用已有的关联规则算法。 相似文献
12.
13.
图挖掘是数据挖掘的一个重要研究方向,而图挖掘主要集中在图数据集内频繁子图的挖掘。频繁子图挖掘技术的关键是建立有效机制减少冗余候选子图,以便高效计算和处理所需的频繁子图。提出了一种基于路径的频繁子图挖掘算法,该算法首先找出所有频繁边从而挖掘出频繁单路径,然后通过组合、双射和操作扩展出较多的频繁路径,再通过连接操作产生所有频繁子图候选集。通过定理证明了该算法的正确性和完整性,从理论上分析了该算法时间复杂度低于现有的算法,最后进行了2个图数据集实验,在候选集产生的数量和时间性能2方面验证了算法的优越性。 相似文献
14.
方刚 《计算机工程与应用》2010,46(25):149-152
针对现有的频繁邻近类别集挖掘算法因产生候选项而存在冗余计算,提出一种无候选项的频繁邻近类别集挖掘算法,其适合在海量数据中挖掘空间对象的频繁邻近类别集;该算法以交叉搜索方式,用产生邻近类别集非空真子集的方法来计算支持数,实现一次扫描数据库挖掘频繁邻近类别集。算法无需产生候选频繁邻近类别集,且计算支持数时无需重复扫描数据库,达到了提高挖掘效率的目的。实验结果表明其在海量空间数据中挖掘频繁邻近类别集时,该算法比现有算法更快速更有效。 相似文献
15.
16.
在分析现有的频繁模式树挖掘的经典算法FREQT和FreqtTree基础上,提出一种新的基于递推式右路径扩展的XML频繁模式树挖掘算法。该算法采用最右路径扩展的思想,利用递推式的候选节点集更新技术来压缩候选节点集,产生数量较少的候选模式,并且在计算候选模式树的支持数时,采用增量式技术,提高算法效率。从理论上证明该算法的正确性,并对通过具体实验验证算法的高效性。 相似文献