首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
多层次关联规则的有效挖掘算法   总被引:30,自引:0,他引:30  
程继华  施鹏飞 《软件学报》1998,9(12):937-941
数据挖掘(Data Mining)被认为是解决“数据爆炸”和“数据丰富,信息贫乏(Data Rich and Information Poor)”的一种有效方法.关联规则(Association Rules)是数据挖掘的重要研究内容.提出了多层次关联规则的挖掘算法——AR_SET,利用集合“或”、“与”运算求解频繁模式(Frequent Itemset),提高了挖掘的效率和速度.实验结果表明,算法AR_SET是有效的,并对AR_SET算法的几个变种进行了讨论.  相似文献   

2.
数据集划分及关联规则挖掘   总被引:1,自引:0,他引:1  
介绍了一种根据数据集中项目的概念层次,利用变精度粗糙集模型对数据集进行划分的方法,设计了相应的关联规则挖掘算法及并行算法,并通过测试分析了算法的挖掘效率和影响挖掘效率的主要因素。  相似文献   

3.
基于频繁模式树的普遍化关联规则挖掘   总被引:2,自引:1,他引:2  
提出了基于频繁模式树的普遍化关联规则挖掘算法 MGAR- FP,充分利用频繁模式树的性质 ,避免大量候选模式的生成和频繁模式匹配 ,提高了挖掘的效率和速度 .实验表明 ,算法是有效的 ,比传统的普遍化关联规则挖掘算法Cum ulate快  相似文献   

4.
对近年来关联规则数据挖掘的主要方法进行了概述,同时介绍了关联规则进一步研究的方向.  相似文献   

5.
多概念层次的数值关联规则挖掘   总被引:2,自引:0,他引:2  
1 引言文[6]中将分类规则挖掘的方法扩展到数值关联规则挖掘的情况,其基本思想是:把一个数值属性x划分为若干个等分区间,于是一个三元组便可对应于一个布尔项目,其中[1,u]表示一个数值区间,之后再用类似于布尔关联规则的挖掘算法进行挖掘。这种采用区间分割的方法来刻画数值属性,存在三点不足之处;1)致使信息丢失;2)经常使规则具有误导性;  相似文献   

6.
赵超 《网友世界》2012,(3):43-45
关联规则作为数据挖掘的一个重要研究分支,其主要的研究目的是从大型数据集中发现隐藏的、有趣的、属性间存在的规律。本文就数据挖掘中的关联规则做了简要论述。  相似文献   

7.
本文引入一种挖掘关联规则的方法,通过挖掘明式或暗示的代表数据仓库特征的语义层次来进行基于语义层次的关联规则挖掘.该方法能有效的从数据仓库中抽取潜在的有用的知识.  相似文献   

8.
关联规则挖掘是数据挖掘的知识模式中比较重要的一项任务,它的目的是发现数据集中所有的频繁模式。根据关联规则定义及属性,可发现关联规则。利用Apriori算法实现了关联规则的挖掘,关联规则可以产生清晰有用的结果;可以广泛应用于各个领域,既可以检验行业内长期形成的知识模式,也能够发现隐藏的新规律,是完成数据挖掘任务的一个重要手段。  相似文献   

9.
彭佳红 《计算机工程》2006,32(9):70-71,74
通过数据库和Web日志构建概念层次树,在继承FP算法思想的基础上,提出了由概念层次树挖掘多层包括交叉层次的关联规则算法。实验结果表明,该算法在性能上比传统算法有了较大的改善,能为客户提供多层次的关联推荐和电子商务的个性化服务。  相似文献   

10.
贾磊  裴仁清 《计算机工程》2003,29(12):29-30,141
针对Apriori算法及ML-T2算法在应用时会造成规则遗失的问题,文章对关联规则进行了研究,并提供了可行的解决方案。其一为不改变原算法从顶到底的思想,充分利用预先设置的minSup值,通过在高层上预存可能会在底层上构成候选大项集的项集来保证有用规则的完全提取;其二则采用从底到顶的思想,运用不产生候选大项集方法,并把它扩展到由底层到顶层的各层建立各自的FP树,这样也不会造成有用规则的丢失。  相似文献   

11.
一种高效的基于采样的关联规则挖掘算法   总被引:1,自引:0,他引:1       下载免费PDF全文
在事务数据集中发现项目间的关联规则是数据挖掘的一个经典问题,但传统的关联规则挖掘方法对于大事务数据集而言,执行效率相对较低。已经有研究表明,采样技术能有效地改善挖掘效率。在分析现有采样方法的基础上,提出了一种新的基于采样的高效关联规则挖掘算法ESMA。该算法采用了更加有效的双向采样策略。通过实验分析表明,该算法明显地加快了大事务数据库中采样的速度,从而降低了CPU时间,而且具有很好的可扩展性。  相似文献   

12.
隐私保护是数据挖掘中很有意义的研究方向。M.Kantarcioglu等提出了针对水平分割数据的保持隐私的关联规则挖掘的算法,探讨了如何在两个垂直分布的私有数据库的联合样本集上施行数据挖掘算法,同时保证不向对方泄露任何与结果无关的数据库数据,针对资料分类算法中应用非常普遍的关联规则挖掘算法,利用安全两方计算协议.给出一个保持隐私的关联规则挖掘协议。  相似文献   

13.
基于参考度的关联规则挖掘   总被引:1,自引:0,他引:1  
针对现有关联规则挖掘的评价标准存在的问题,提出在评价标准中增加参考度,并给出了参考度的定义和基于参考度的关联规则挖掘算法。利用参考度将关联规则分为正关联规则、负关联规则和无效关联规则,从而可以用算法挖掘带有负项的关联规则。最后给出了新算法的实验分析。  相似文献   

14.
关联规则挖掘中对Apriori算法的研究   总被引:3,自引:1,他引:3       下载免费PDF全文
针对Apriori寻找频繁项集问题,提出了基于垂直事务列表的树形结构的挖掘算法。该算法结合项集的有序特性,使生成树的每一层结点从左往右按支持度大小升序排列,这样得到的候选频繁项集的集合是最小的,大大减少了候选频繁项集的数量,而且能保持频繁项集的完整性,从而节约了计算开销,提高了算法的效率。  相似文献   

15.
一种有效的基于图的关联规则挖掘算法   总被引:2,自引:0,他引:2  
陈明  史忠植  王文杰 《计算机应用》2006,26(11):2654-2656
基于图的关联规则挖掘算法是一种通过构建关联图并直接生成候选频繁项集,进而验证得到所有频繁项集的算法。在该算法中,对候选项集的验证操作占用了大量的时间,为此提出了改进算法。改进主要体现在两个方面:按支持度降序对频繁1项重新编号再构建关联图;利用Apriori性质删减用来生成候选项集的冗余扩展项节点。实验结果表明,在最小支持度阈值较小时,改进算法有效减少了冗余的候选频繁项集,提高了算法的性能。  相似文献   

16.
关联规则挖掘技术研究进展*   总被引:3,自引:2,他引:3  
为帮助人们深入研究关联规则挖掘技术,总结了关联规则的分类方法、评价方法以及相关技术的最新进展,特别是对关联规则的主要算法进行了详细的介绍,并探讨未来的发展方向。该研究比较系统全面,对将来进一步深入分析关联规则挖掘技术具有指导意义。  相似文献   

17.
王新 《计算机应用》2004,24(8):63-65
在关系数据库中,数据丢失现象常常是不可避免的。在不完全数据库中挖掘关联规则的关键问题是如何估算关联规则的支持度和置信度。给出了不完全数据库中关联规则挖掘的两种求估方法,并进行了简单的比较。  相似文献   

18.
Generalized multidimensional association rules   总被引:2,自引:0,他引:2       下载免费PDF全文
The problem of association rule mining has gained considerable prominence in the data mining community for its use as an important tool of knwledge discovery from large-scale databases.Ande there has been a sput of research activities around this problem.Traditional association rule mining is limited to intra-transaction.Only recently the concept on N-dimensional inter-transaction association rule(NDITAR)was proposed by H.J.Lu.This paper modifies and extends Lu‘s definition of NDITAR based on the analysis of its limitations,and the generalized multidimensional association rule(GMDAR)is subsequently introduced,which is ore general,flexible and reasonable than NDITAR.  相似文献   

19.
关联挖掘中的时效度研究   总被引:1,自引:0,他引:1  
传统的关联挖掘算法,以支持度和置信度作为评价标准来衡量规则是否有价值。然而,这种模式不能体现出数据的时效敏感特性,如Web数据和长期积累数据。文中将首次建立一个全新的时基模型来重新估计数据规则的价值,并给出时效度(time validity)作为新的规则价值衡量标准。最后,给出了基于这个新的时基模型的一种新并行算法。这种算法使得我们在挖掘过程中使用增量挖掘,而且使得用户可以通过互操作来优化挖掘过程。  相似文献   

20.
针对关联规则挖掘应用所面临的困难,分析了XML语言的技术特点,提出了一种基于半结构化数据的关联规则挖掘模式。该模式充分利用了半结构化数据源的自描述性、开放性和可扩展性方面的优势。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号