共查询到19条相似文献,搜索用时 62 毫秒
1.
在分析原有定义不足的基础上,提出一种新的动态关联规则,其支持度向量和置信度向量与经典定义相吻合,能更好地反映规则随时间变化的动态信息.进一步提出两种新的动态关联规则挖掘算法:ITS和EFP growth.其中:两阶段ITS算法具有较好的可理解性;基于扩展FP 树的EFP growth算法适宜于高密度海量数据的挖掘.实验
结果表明,该算法具有较好的挖掘性能和可扩展性,适用于动态关联规则的有效挖掘.
2.
一种新的广义关联规则挖掘算法 总被引:2,自引:0,他引:2
通过对广义关联规则挖掘中的数据源的分析研究.采用分层抽样的数学方法筛选数据源.提出了一种效率更高的挖掘广义关联规则的新算法即分层抽样算法(Stratify Sample)SS,并进行了理论证明和分析. 相似文献
3.
提出一种基于TD-FP-growth的模糊关联规则挖掘算法.首先,使用3种t-模算子以及由其产生的蕴涵算子计算模糊频繁项的支持度和规则的蕴涵度,产生的关联规则能表示模糊项间的确定性和渐近性逻辑语义;然后,以事务的惟一标识为键值,散列存储每个事务相对FP-tree中每个结点所表示模糊项的隶属度,使TD-FP-growth适用于模糊频繁项的挖掘,并分析了算法的时间和空间复杂度;最后,实验结果表明该算法比基于apriori的模糊频繁项挖掘算法在时间方面更加有效. 相似文献
4.
在关联规则挖掘FP-Growth算法的基础上,提出一种基于MFP树的快速关联规则挖掘算法。文中给出了MFP算法的工作原理。MFP算法能在一次扫描事务数据库的过程中,把该数据库转换成MFP树,然后对MFP树进行关联规则挖掘。MFP算法比FP-Growth算法减少一次对事务数据的扫描,因此具有较高的时间效率。 相似文献
5.
一种基于MFP树的快速关联规则挖掘算法 总被引:1,自引:0,他引:1
在关联规则挖掘FP-Growth算法的基础上,提出一种基于MFP树的快速关联规则挖掘算法。文中给出了MFP算法的工作原理。MFP算法能在一次扫描事务数据库的过程中,把该数据库转换成MFP树,然后对MFP树进行关联规则挖掘。MFP算法比FP-Growth算法减少一次对事务数据的扫描,因此具有较高的时间效率。 相似文献
6.
7.
8.
对经典关联规则挖掘算法进行深入研究的基础上,结合数据立方体的结构特点和OLAP技术,给出了一种高效的多维关联规则挖掘算法,并对不同数据立方体下的算法的性能进行了分析比较。 相似文献
9.
一种新的多维关联规则挖掘算法 总被引:12,自引:0,他引:12
关联规则是数据挖掘中一个重要课题.文章给出一种基于遗传算法和蚂蚁算法相结合的多维关联规则挖掘算法.新算法利用了遗传和蚂蚁算法共有的良好全局搜索能力,并克服了遗传算法局部搜索能力弱和蚂蚁算法搜索速魔慢的缺陷.实验结果表明,新算法在对具有稀疏特性的多维关联规则的挖掘中体现了良好的性能. 相似文献
10.
LIU Zhi- yi 《数字社区&智能家居》2008,(18)
对关联规则算法进行了研究和分析,基于候选集的Apriori-like算法需要反复扫描数据库,并产生大量的候选集,在挖掘低支持度、长模式的规则时效率低下。针对算法的缺陷,该文提出了一种PS算法,优化了关联规则的挖掘。实验结果证明了该算法的有效性。 相似文献
11.
针对构建FP-Tree时存在的大量内存消耗问题,提出了CCFP(constraint clip FP-tree)算法,该算法利用有项和缺项约束对事务数据库进行修剪后构造简化的FP-Tree,经再一次扫描后得到关联规则.实验结果表明:该算法较一般的FP-Tree算法能节省大量的内存空间,同时,运行效率也略有提高. 相似文献
12.
Bilal Sowan Keshav Dahal M.A. Hossain Li Zhang Linda Spencer 《Expert systems with applications》2013,40(17):6928-6937
This paper presents an investigation into two fuzzy association rule mining models for enhancing prediction performance. The first model (the FCM–Apriori model) integrates Fuzzy C-Means (FCM) and the Apriori approach for road traffic performance prediction. FCM is used to define the membership functions of fuzzy sets and the Apriori approach is employed to identify the Fuzzy Association Rules (FARs). The proposed model extracts knowledge from a database for a Fuzzy Inference System (FIS) that can be used in prediction of a future value. The knowledge extraction process and the performance of the model are demonstrated through two case studies of road traffic data sets with different sizes. The experimental results show the merits and capability of the proposed KD model in FARs based knowledge extraction. The second model (the FCM–MSapriori model) integrates FCM and a Multiple Support Apriori (MSapriori) approach to extract the FARs. These FARs provide the knowledge base to be utilized within the FIS for prediction evaluation. Experimental results have shown that the FCM–MSapriori model predicted the future values effectively and outperformed the FCM–Apriori model and other models reported in the literature. 相似文献
13.
一种新的基于FP-Tree的关联规则增量式更新算法 总被引:2,自引:0,他引:2
挖掘关联规则是数据挖掘研究的一个重要方面,目前已经提出了许多算法用于高效地发现大规模数据库中的关联规则,而维护已发现的关联规则同样是重要的.针对在事务数据库增加和最小支持度同时发生变化的情况下,如何进行关联规则的更新问题进行了研究,提出了一种新的基于频繁模式树的关联规则增量式更新算法,并对该算法进行了分析和讨论. 相似文献
14.
介绍了假日旅游信息数据挖掘的概念,提出了一种改进的分布式抽样关联规则挖掘算法DS-ARM,给出了算法的实现过程,并对算法性能进行了测试,利用DS-ARM算法对假日旅游者在目的地的旅游行为模式进行了研究。 相似文献
15.
挖掘关联规则的两大经典算法Apriori和FP-tree算法都是以批处理方式处理所有事务。但在实际应用中,新事务频繁地出现,这就需要不断更新关联规则。为了提高更新效率,有效减少扫描原数据库的次数,基于次频繁项的概念,在快速更新频繁模式树(FUFP-tree)算法的基础上,提出了一种改进的算法。实验结果表明新算法具有良好的性能。 相似文献
16.
Multi-objective genetic algorithms based automated clustering for fuzzy association rules mining 总被引:1,自引:0,他引:1
Researchers realized the importance of integrating fuzziness into association rules mining in databases with binary and quantitative
attributes. However, most of the earlier algorithms proposed for fuzzy association rules mining either assume that fuzzy sets
are given or employ a clustering algorithm, like CURE, to decide on fuzzy sets; for both cases the number of fuzzy sets is
pre-specified. In this paper, we propose an automated method to decide on the number of fuzzy sets and for the autonomous
mining of both fuzzy sets and fuzzy association rules. We achieve this by developing an automated clustering method based
on multi-objective Genetic Algorithms (GA); the aim of the proposed approach is to automatically cluster values of a quantitative
attribute in order to obtain large number of large itemsets in less time. We compare the proposed multi-objective GA based
approach with two other approaches, namely: 1) CURE-based approach, which is known as one of the most efficient clustering
algorithms; 2) Chien et al. clustering approach, which is an automatic interval partition method based on variation of density.
Experimental results on 100 K transactions extracted from the adult data of USA census in year 2000 showed that the proposed
automated clustering method exhibits good performance over both CURE-based approach and Chien et al.’s work in terms of runtime,
number of large itemsets and number of association rules. 相似文献
17.
18.
利用时态关联规则的分析,可以得到一系列相关性的项目集合,从而为决策提供更加有利的帮助和支持。在研究了传统的静态关联规则的基础上,提出了一种以交易规模的变化率为处理对象,即考虑各类项目交易量的变动状况的时态关联规则的表述与挖掘方法,并对其表述形式及算法实现进行了探讨。 相似文献
19.
分布式数据库多层关联规则挖掘算法研究 总被引:1,自引:0,他引:1
对分布式数据库多层关联规则挖掘的理论和方法进行了研究,提出了一种基于频繁模式树FP-tree(Freguent Pattern tree)的快速挖掘算法DMAML_FPT(Distributed Mining Algorithm of Multiple Level based on FP-tree)。与类Apriori算法相比较,该算法最多只需扫描数据库三遍,不需产生和传输大量的候选项集,减少了数据通信量,从而提高了数据挖掘的效率。 实验结果表明算法DMAML_FPT是可行和有效的。 相似文献