共查询到20条相似文献,搜索用时 62 毫秒
1.
基于图的关联规则挖掘高效算法研究 总被引:4,自引:0,他引:4
通过对文献[1]中介绍的基于图的关联规则挖掘算法的详细分析,提出了一种新的基于完全子图的关联规则挖掘算法。该算法利用完全子图与频繁项集的对应关系,以完全子图结点的度作为判断标准,完全避免了不必比较项目之间的比较:同时通过设置关联图结点的order值,完全避免了相同项目集的重复比较,从而在寻找k-项频繁集(k〉3)的过程中,时间复杂度远小于原算法的1/k-1。因此,该算法减小了存傅空间,加快了挖掘速度,提高了算法的效率。 相似文献
2.
本文提出了一种基于图的关联规则挖掘的改进算法。首先介绍了基于图的关联规则挖掘算法;然后,在此基础上对原算法进行了修改,通过在图中查找完全子图来寻找频繁项集;最后,对原算法、改进算法和Apriori算法的优缺点进行了简单的比较分析。 相似文献
3.
4.
基于图的关联规则改进算法 总被引:1,自引:0,他引:1
黄红星 《计算机与数字工程》2009,37(12):38-41,162
关联规则挖掘是数据挖掘研究的最重要课题之一。基于图的关联规则挖掘DLG算法通过一次扫描数据库构建关联图,然后遍历该关联图产生频繁项集,有效地提高了关联规则挖掘的性能。在分析该算法基本原理基础上,提出了一种改进的算法—DLG#。改进算法在关联图构造同时构造项集关联矩阵,在候选项集生成时结合关联图和Apriori性质对冗余项集进行剪枝,减少了候选项集数,简化了候选项集的验证。比较实验结果表明,在不同数据集和不同支持度阈值下,改进算法都能更快速的发现频繁项集,当频繁项集平均长度较大时性能提高明显。 相似文献
5.
6.
7.
为了提高关联规则挖掘效率,在挖掘频繁项目集的同时,挖掘出包含频繁项目集的事务集,提出了基于字符权图的关联规则挖掘算法。首先,提出了字符权图的概念,发现和证明了它的一些性质。基于此,提出了挖掘频繁项目集及包含频繁项目集的事务集的算法。时间和空间复杂性的分析表明,该算法是合理和高效的。 相似文献
8.
李红 《数字社区&智能家居》2006,(11):19-19,29
改进频繁项集算法的效率是提高关联规则挖掘性能的重要环节.本文提出了基于包含频繁1-项集的事务集的关联规则挖掘算法,并通过实例说明了算法的有效性,且与Apriori这一经典算法作了比较。 相似文献
9.
本文研究如何快速有效地从XML数据中挖掘频繁模式,提出了从XML数据中挖掘频繁模式的增量式算法FreqtTree.该算法首先将XML文档转化成DOM树,然后从DOM树中挖掘所有频繁模式.FreqtTree算法采用最右扩展技术,对DOM树仅遍历一次,因此具有很高的效率.在此基础上详细描述了基于DOM树的关联规则挖掘算法DFreqtTree.最后将本文提出的算法用Java语言实现,并进行性能分析,结果表明算法是高效可行的. 相似文献
10.
信息时代的到来,产生了大量的数据。在大量的数据背后隐藏着许多重要的信息,如果能把这些信息从数据库中抽取出来,将会创造很多潜在的利润。关联规则的挖掘已被广泛应用在实际生活中。但过去的研究往往认为数据库各个项目的重要程度是相同的,而事实上,用户对项目的看重程度是不同的,因此已有算法挖掘出来的并不一定是我们感兴趣的规则。针对这种情况.提出了加权关联规则。 相似文献
11.
LIU Zhi- yi 《数字社区&智能家居》2008,(18)
对关联规则算法进行了研究和分析,基于候选集的Apriori-like算法需要反复扫描数据库,并产生大量的候选集,在挖掘低支持度、长模式的规则时效率低下。针对算法的缺陷,该文提出了一种PS算法,优化了关联规则的挖掘。实验结果证明了该算法的有效性。 相似文献
12.
挖掘关联规则的并行算法 总被引:3,自引:0,他引:3
从大型数据库中挖掘关联规则是数据挖掘中一个重要的课题 .从挖掘要求的时间和空间上看 ,传统的顺序算法已很难适应于现实中不断增大的数据库规模 .而研究和发展高性能、可扩展的并行算法对解决这一问题就显得十分必要 .本文介绍了挖掘关联规则一些主要的并行算法 ,并对它们进行了一定分析 ,指出了发展并行算法要考虑的一些问题 . 相似文献
13.
随着大型数据库系统在各行业普及,数据库中存储的数据量急剧增大,数据挖掘是从海量数据中挖掘有效或重要信息的过程。关联规则挖掘作为数据挖掘的重要研究课题,被广泛地应用。伴随挖掘数据库的规模不断发生变化,对数据的需求也会有所不同,如何从扩展数据库中高效地对已经推导出的关联规则进行更新具有非常重要的应用价值,这就是所谓的增量式挖掘关联规则的问题。 相似文献
14.
在研究关联规则挖掘算法的基础上,对并行关联规则算法进行了比较全面的分析,并给出了并行数据挖掘的计算框架。提出了一个以计算服务器为中心节点的并行挖掘算法,可以发挥各局部节点的优势,无需各局部节点进行通信,减少了各局部节点的通信负荷。通过理论分析和实验数据验证,该算法具有较好的可扩展性和海量处理能力,特别是在节点数目较多的情况下更显示出优势。 相似文献
15.
基于分布数据库的快速关联规则挖掘算法 总被引:8,自引:0,他引:8
关联规则发现是数据挖掘的重要研究内容,随着数据库中数据的不断增加,大数据集环境下的关联规则发现日益受到重视,分布式关联规则发现是解决这一问题的有效方法。分布式数据库环境下的关联规则挖掘算法中,时间开销主要体现在两方面(:1)频繁项目集的确定;(2)网络的通讯量。为了解决第一个问题,文章提出了一种基于二进制形式的候选频繁项目集生成和相应的计算支持数算法,该算法只需对挖掘对象进行一些”或”、”与”、”异或”等逻辑运算操作,显著降低了算法的实现难度。将该算法与DMA算法相结合提出改进算法FDMA。理论分析和实验结果表明,算法FDMA大大提高了关联规则挖掘的效率,算法是有效可行的。 相似文献
16.
关联规则提取中对Apriori算法的一种改进 总被引:25,自引:0,他引:25
王创新 《计算机工程与应用》2004,40(34):183-185
关联规则的提取是数据挖掘中的重要研究课题,该文对关联规则提取中的Apriori算法进行了深入研究,指出了该算法的某些不足,提出了一种改进算法。实验结果表明,该算法性能明显优于Apriori算法,具有较高的推广价值。 相似文献
17.
时态关联规则挖掘是针对在一段时间范围内的关联挖掘,在现实中有较多的应用。现有的大多数时态关联挖掘算法或者需要多次扫描数据库,或者没有考虑各个项在数据集上出现或结束时间上的不同,因而挖掘性能受到较大的制约。为此,本文提出一种增量式的面向具有不同时间出现与结束的项的时态关联规则挖掘算法。为减少存储方面的开销,只需保存已挖掘过的历史数据集中的频繁1项集。为了减少数据的扫描量,通过有效的剪枝策略,有选择性地扫描相关事务项,至多只需扫描一次完整的数据库。实验证明,该算法具有较好的挖掘性能。 相似文献
18.
发现频繁项目集是关联规则挖掘的关键问题,而发现的过程是高花费的。因此,要求对增量挖掘算法进行深入研究。这使得关联规则的更新成为数据挖掘技术中的一个重要内容。文中就关联规则的增量式更新问题进行了探讨,针对最小支持度发生变化时的增量式更新算法(IUA)的不足,提出了改进算法(AIUA),在保证算法有效的同时提高了效率。 相似文献
19.
加权关联规则的改进算法 总被引:7,自引:2,他引:7
论文讨论了加权关联规则问题,针对布尔类型的加权关联规则问题提出一种改进算法。该算法首先利用普通的关联规则算法产生频繁集,然后在该频繁集的基础上产生加权频繁集。同时,给出了最优的最小支持度设定方法,保证了普通关联规则算法所产生的频繁集为加权频繁集的超集。该算法有较高的效率,并且能够有效利用已有的关联规则算法。 相似文献
20.
针对关联规则挖掘问题提出一种新的算法,探讨商品与利润间的关系,称为权重式多重支持度关联规则挖掘算法。此算法可针对不同利润的商品定出不同的支持度阈值,由此产生的关联规则,可以解决高单价但交易次数稀少的商品不易被挖掘的问题。 相似文献