共查询到16条相似文献,搜索用时 62 毫秒
1.
杨泽民 《中北大学学报(自然科学版)》2007,28(5):417-421
传统的关联规则并行挖掘算法中存在着产生大量的候选项集和通信量高的缺点,本文在分析已有并行挖掘关联规则算法的优缺点的基础上,提出了一个效率较高的并行优化关联规则挖掘算法EPMAR(Efficient Parallel Mining Association Rules),并与其它相应的算法进行了比较.实验结果证明:算法EPMAR是有效的,具有一定的扩展性. 相似文献
2.
增量式更新算法能充分利用已挖掘出的知识来提高挖掘效率,是数据挖掘高效算法中的一个主要方向.分析了典型的关联规则增量式更新算法波折法FUP算法的不足,提出了一种改进的关联规则增量式更新算法,新算法极大地降低了存储空间和挖掘时间需求,从而提高了整个关联规则挖掘的效率. 相似文献
3.
文章通过对FP-Growth算法分析,提出的改进算法能有效地减少需遍历的树的节点数,从而降低了时间开销。实验表明:改进算法能明显地提高挖掘效率。 相似文献
4.
一种改进的关联规则挖掘算法 总被引:2,自引:0,他引:2
本文在Aprioi算法的基础上,引入了临时数据库及多支持度,使交易数据库的规模不断缩小,同时又灵活控制了各频繁项集产生的数量,结果表明该算法对关联规则挖掘较为有效。 相似文献
5.
6.
孙广维 《吉林建筑工程学院学报》2011,28(6):72-74
关联规则挖掘是数据挖掘及知识发现领域的重要研究内容之一,其核心任务是挖掘数据库中的频繁项集.Apriori算法是频繁项集挖掘的有效算法.在Apriori的算法中,采用哈希树存储平凡项集的候补项集以便快速计算其支持度.本文在分析算法所存在的效率瓶颈的基础上,提出了一个有效的改进算法,通过利用一维数组替代算法中复杂的哈希树... 相似文献
7.
一个改进项目的加权关联规则挖掘算法 总被引:1,自引:0,他引:1
刘燕 《昆明理工大学学报(自然科学版)》2008,33(4)
提出了一个改进的项目加权关联规则挖掘算法.该算法利用一个加权频繁项目集必须满足的加权支持度下界,对加权频繁候选项目集进行剪枝,该下界计算简便,可以减少挖掘的计算量.理论分析和实验表明本算法和MINWAL(W)相比,具有生成候选集数量少、挖掘效率高等特点,特别在项目权值相差不大时,本算法的优势更明显. 相似文献
8.
数据仓库中关联规则的元规则制导挖掘改进策略 总被引:1,自引:0,他引:1
许多数据仓库和数据挖掘的理论都曾说明元规则是一个非常重要的概念,也有一些研究提到元规则,但却很少利用元规则来进行数据仓库的关联规则的挖掘。本针对在元规则制导下的数据仓库关联规则挖掘,提出一种简单的、充分利用元规则的、类Apriori和类决策树方法的实现策略,减少了查询数据仓库的次数,使数据挖掘过程中的存储结构简单,形成了快速查询。 相似文献
9.
汤震 《华北水利水电学院学报》2009,30(5):73-76
根据日常商务数据的特点,提出了商业应用系统中进行数据挖掘的改进的Apriori算法和对点击流数据进行挖掘的改进的多支持度关联规则算法,并结合具体实例进行了分析.分析结果表明,2种改进的算法可以有效地提高系统数据挖掘的效率. 相似文献
10.
借鉴关联规则挖掘的思想,引入序列项目集的概念,使算法能够处理集合事物和具有序列特性的项目;通过递推的方法依次得出不同长度的特征字段,并利用偏移属性集加以约束去除无效字段,有效控制约束频繁集的规模;最后依据选择策略从约束频繁集中选出最终的特征字段。实验结果表明只要选取合适的参数,用该方法提取协议特征是行之有效的。 相似文献
11.
为了从海量的信息资源库中进行析取、识别和发现潜在正确和有用、前所未知的、最终可理解的知识,从数据挖掘技术的研究入手,对关联规则挖掘算法Apriori算法的关键思想以及性能进行了研究,在此基础上分析和探讨了Apriori Mend算法,并给出了该算法的实现思想和步骤,同时通过实例说明了算法的执行过程,该算法提高了原算法的效率。 相似文献
12.
可视化数据挖掘是数据挖掘领域的一个热点。文章提出了一种基于平行坐标的频繁项集可视化方法,对挖掘过程中产生的频繁项集及其支持度进行可视化的描述,以此来解决传统关联规则挖掘过程不可见的弊病。 相似文献
13.
基于改进遗传算法的多维关联规则挖掘方法及应用 总被引:1,自引:1,他引:1
对遗传算法进行改进,并应用于多维关联规则挖掘中.在该算法中提出了一种基于免疫机制的新选择策略,并引入随机数,采用自适应方法随机动态选取交叉和变异概率.这种新算法不仅有效地抑制了早熟收敛现象,而且大大提高了搜索效率. 相似文献
14.
针对已有的对低支持度关联规则进行挖掘的算法中没有提出对具有多个相关项的关联规则进行挖掘的有效方法,本文提出一种能够对低支持度关联规则的多个相关项进行有效挖掘的方法。算法基于相似度来衡量各个相关项的关联程度,在已有算法的基础上增加了一次特殊的矩阵转换,从而将对项的相似度衡量方法进行了转换,转换后的矩阵可以基于Apriori性质来拓展多个相似相关项。算法在低支持度情况下具有较高的挖掘效率和良好的挖掘效果,算法还可以用来挖掘多个项之间的排斥规则。 相似文献
15.
针对Apriori算法寻找频繁项集需要反复扫描数据库的问题,提出了一种将事务数据布尔化,并在其基础上通过优化连接和剪枝,快速查找频繁项集的思想。即通过优化连接和剪枝,减少候选项集,并根据判断相应布尔向量"与"运算的结果,快速地归纳出频繁项集。研究和实验表明,该算法不仅只需扫描一次数据库,而且还具有查找速度快,节省内存空间和处理项目集维数多等优点。 相似文献
16.
挖掘告警序列间关联规则的算法都受到最小支持度的限制,仅能够得到频繁告警序列间的关联规则. 对此,提出了一种以高相关度、高置信度为条件,通过聚类找到特征相同的网元告警群,然后基于相关度统计的挖掘算法. 实验结果表明,该算法可以高效、准确地挖掘出电信网络告警数据库中频繁和非频繁告警序列间的关联规则. 相似文献