共查询到19条相似文献,搜索用时 125 毫秒
1.
2.
关于关联规则经典算法的一种改进 总被引:1,自引:0,他引:1
就数据挖掘中关联规则的概念和作用进行了探讨,对关联规则中寻找大项集的关键算法作出了剖析,提出了一种关联规则经典Apriori算法的改进算法FP-树算法,并给出了利用FP-树算法来求解实际问题的过程,通过对两个算法的比较表明新算法的优越性。 相似文献
3.
4.
5.
基于HMT和哈希树的Apriori并行算法研究 总被引:1,自引:0,他引:1
为了进一步提高基于HMT和哈希树的Apriori算法的性能,提出了一种基于独立内存并行环境的并行化方案,充分利用空闲的计算资源来提高关联规则数据挖掘的效率.将原始数据集平均分配到并行环境中的各个子计算节点中,在各个子计算节点中并行地进行关联规则支持度计数,并从各个子计算节点中收集合并支持度计数的结果,得到目标频繁项集,进而实现Apriori算法的并行化.实验结果表明,该并行化方案可以很好地提高原算法的效率. 相似文献
6.
针对Apriori算法的主要问题,提出了关联规则挖掘的两种改进算法:高维分解法通过遍历事务数据库形成高维频繁项目集和关联规则,然后直接分解高维关联规则得到低维关联规则;前缀广义链表法先通过对事务数据库的遍历形成前缀链表,然后再次扫描事务数据库,遍历其前缀链表,根据判断每个事务是否与其中的一条路径完全或部分重合而找到关联规则。这两种算法均能极大地减少事务数据库的遍历和大规模候选序列集的产生,提高挖掘算法的效率,使得关联规则的产生简单化。 相似文献
7.
基于最近挖掘结果的关联规则更新算法 总被引:3,自引:0,他引:3
Apriori算法是著名的关联规则挖掘算法,它必须对数据库进行多次遍历,针对关联规则的维护问题,提出利用最近一次关联规则的挖掘结果进行更新的算法,仅需对数据库进行两次遍历,提高了关联规则的更新效率。 相似文献
8.
关联分类通常产生大量的分类规则,导致在分类新实例时经常产生规则冲突问题。针对这种规则冲突问题,提出了一种基于改进关联分类的两次学习框架。利用频繁且互关联的项集产生分类规则改进关联分类算法,有效减少了规则数。应用改进的关联分类算法产生的一级规则一次性分离出训练集中规则冲突的所有实例。然后,在冲突实例上应用改进的关联分类算法进行第二次学习得到二级规则。分类新实例时,首先利用第一级规则进行分类。如果出现规则冲突,则利用第二级规则分类该实例。实验结果表明,基于改进关联分类的两次学习方法降低了规则冲突比率,并且显著提高了分类准确率。 相似文献
9.
在大型数据库项目之间发现关联规则是一个重要的数据挖掘问题,而挖掘出的关联规则数目常常是巨大的.文中介绍了简单关联规则和原关联规则的概念,而传统算法挖掘出的关联规则集中的任何规则,均可以由原关联规则导出,并且原关联规则的数目远远小于传统算法挖掘出的关联规则数目.对简单关联规则和原关联规则进行了分析比较,给出了挖掘原关联规则算法,并举例说明算法的执行过程. 相似文献
10.
描述了分类和广义关联规则的概念及采掘广义关联规则的问题。首先叙述了问题解决的基本算法。随后提出了累积算法,它的优化处理和算法过程。最后通过一组实验显示两个算法的比较结果。图表显示累积算法明显优于基本算法。 相似文献
11.
关联规则挖掘算法的研究主要集中在提高Aptiori算法的效率上,而对带否定项关联规则的研究比较少。本文分析了目前带否定关联规则的两种基本算法,并在这两种基本算法的基础上进行改进。提出了一种新的挖掘算法。这种算法减少了在数据库中进行扫描计数的候选集个数,对于提高挖掘带否定关联规则的效率有一定的意义。 相似文献
12.
关联规则挖掘的基本算法 总被引:6,自引:0,他引:6
介绍了加权模糊关联规则挖掘算法的基本思想及实现步骤,并给出挖掘算法的多种策略。在此基础上,分析了加权模糊关联规则与模糊关联规则、布尔型属性加权关联规则、布尔型属性关联规则之间的内在联系,并指出加权模糊关联规则挖掘算法是一种最基本的关联规则挖掘算法,蕴涵了其它3种关联规则挖掘算法。 相似文献
13.
14.
15.
16.
17.
采掘关联规则的高效并行算法 总被引:33,自引:1,他引:32
采掘关联规则是数据采掘领域的一个重要问题。文中对采掘关联规则问题进行了简单的回顾,给出了一种提高顺序采掘关联规则效率的方法;分析了已有并采掘关联规则算法的优缺点;设计了一个效率较高的并行采掘关联规则的算法PMAR;并与其它相应算法进行了比较,实验证明,算法PMAR是有效的。 相似文献
18.
加权关联规则的改进算法 总被引:7,自引:2,他引:7
论文讨论了加权关联规则问题,针对布尔类型的加权关联规则问题提出一种改进算法。该算法首先利用普通的关联规则算法产生频繁集,然后在该频繁集的基础上产生加权频繁集。同时,给出了最优的最小支持度设定方法,保证了普通关联规则算法所产生的频繁集为加权频繁集的超集。该算法有较高的效率,并且能够有效利用已有的关联规则算法。 相似文献
19.
典型关联规则挖掘算法的分析与比较 总被引:3,自引:0,他引:3
关联规则的发现是数据挖掘的一个重要方面,目前许多研究人员正致力于关联规则的快速开采算法的研究。文中介绍了几种典型的开采大型事务数据库中所有关联规则的算法,特别针对算法过程中产生候选频繁项集的大小和所需扫描事务数据库的次数这两个影响关联规则挖掘效率的关键问题,分析各个算法采用的解决策略及相应的局限性,并比较它们的时间效率和空间效率。最后展望了关联规则挖掘算法的研究方向。 相似文献