共查询到20条相似文献,搜索用时 46 毫秒
1.
多层次关联规则的有效挖掘算法 总被引:30,自引:0,他引:30
数据挖掘(Data Mining)被认为是解决“数据爆炸”和“数据丰富,信息贫乏(Data Rich and Information Poor)”的一种有效方法.关联规则(Association Rules)是数据挖掘的重要研究内容.提出了多层次关联规则的挖掘算法——AR_SET,利用集合“或”、“与”运算求解频繁模式(Frequent Itemset),提高了挖掘的效率和速度.实验结果表明,算法AR_SET是有效的,并对AR_SET算法的几个变种进行了讨论. 相似文献
2.
3.
基于频繁模式树的普遍化关联规则挖掘 总被引:2,自引:1,他引:2
提出了基于频繁模式树的普遍化关联规则挖掘算法 MGAR- FP,充分利用频繁模式树的性质 ,避免大量候选模式的生成和频繁模式匹配 ,提高了挖掘的效率和速度 .实验表明 ,算法是有效的 ,比传统的普遍化关联规则挖掘算法Cum ulate快 相似文献
5.
多概念层次的数值关联规则挖掘 总被引:2,自引:0,他引:2
1 引言文[6]中将分类规则挖掘的方法扩展到数值关联规则挖掘的情况,其基本思想是:把一个数值属性x划分为若干个等分区间,于是一个三元组便可对应于一个布尔项目,其中[1,u]表示一个数值区间,之后再用类似于布尔关联规则的挖掘算法进行挖掘。这种采用区间分割的方法来刻画数值属性,存在三点不足之处;1)致使信息丢失;2)经常使规则具有误导性; 相似文献
6.
关联规则作为数据挖掘的一个重要研究分支,其主要的研究目的是从大型数据集中发现隐藏的、有趣的、属性间存在的规律。本文就数据挖掘中的关联规则做了简要论述。 相似文献
7.
本文引入一种挖掘关联规则的方法,通过挖掘明式或暗示的代表数据仓库特征的语义层次来进行基于语义层次的关联规则挖掘.该方法能有效的从数据仓库中抽取潜在的有用的知识. 相似文献
8.
9.
通过数据库和Web日志构建概念层次树,在继承FP算法思想的基础上,提出了由概念层次树挖掘多层包括交叉层次的关联规则算法。实验结果表明,该算法在性能上比传统算法有了较大的改善,能为客户提供多层次的关联推荐和电子商务的个性化服务。 相似文献
10.
针对Apriori算法及ML-T2算法在应用时会造成规则遗失的问题,文章对关联规则进行了研究,并提供了可行的解决方案。其一为不改变原算法从顶到底的思想,充分利用预先设置的minSup值,通过在高层上预存可能会在底层上构成候选大项集的项集来保证有用规则的完全提取;其二则采用从底到顶的思想,运用不产生候选大项集方法,并把它扩展到由底层到顶层的各层建立各自的FP树,这样也不会造成有用规则的丢失。 相似文献
11.
在事务数据集中发现项目间的关联规则是数据挖掘的一个经典问题,但传统的关联规则挖掘方法对于大事务数据集而言,执行效率相对较低。已经有研究表明,采样技术能有效地改善挖掘效率。在分析现有采样方法的基础上,提出了一种新的基于采样的高效关联规则挖掘算法ESMA。该算法采用了更加有效的双向采样策略。通过实验分析表明,该算法明显地加快了大事务数据库中采样的速度,从而降低了CPU时间,而且具有很好的可扩展性。 相似文献
12.
沈旭昌 《计算机工程与设计》2005,26(3):750-751,767
隐私保护是数据挖掘中很有意义的研究方向。M.Kantarcioglu等提出了针对水平分割数据的保持隐私的关联规则挖掘的算法,探讨了如何在两个垂直分布的私有数据库的联合样本集上施行数据挖掘算法,同时保证不向对方泄露任何与结果无关的数据库数据,针对资料分类算法中应用非常普遍的关联规则挖掘算法,利用安全两方计算协议.给出一个保持隐私的关联规则挖掘协议。 相似文献
13.
14.
针对Apriori寻找频繁项集问题,提出了基于垂直事务列表的树形结构的挖掘算法。该算法结合项集的有序特性,使生成树的每一层结点从左往右按支持度大小升序排列,这样得到的候选频繁项集的集合是最小的,大大减少了候选频繁项集的数量,而且能保持频繁项集的完整性,从而节约了计算开销,提高了算法的效率。 相似文献
15.
16.
关联规则挖掘技术研究进展* 总被引:3,自引:2,他引:3
为帮助人们深入研究关联规则挖掘技术,总结了关联规则的分类方法、评价方法以及相关技术的最新进展,特别是对关联规则的主要算法进行了详细的介绍,并探讨未来的发展方向。该研究比较系统全面,对将来进一步深入分析关联规则挖掘技术具有指导意义。 相似文献
17.
在关系数据库中,数据丢失现象常常是不可避免的。在不完全数据库中挖掘关联规则的关键问题是如何估算关联规则的支持度和置信度。给出了不完全数据库中关联规则挖掘的两种求估方法,并进行了简单的比较。 相似文献
18.
The problem of association rule mining has gained considerable prominence in the data mining community for its use as an important tool of knwledge discovery from large-scale databases.Ande there has been a sput of research activities around this problem.Traditional association rule mining is limited to intra-transaction.Only recently the concept on N-dimensional inter-transaction association rule(NDITAR)was proposed by H.J.Lu.This paper modifies and extends Lu‘s definition of NDITAR based on the analysis of its limitations,and the generalized multidimensional association rule(GMDAR)is subsequently introduced,which is ore general,flexible and reasonable than NDITAR. 相似文献
19.
20.
针对关联规则挖掘应用所面临的困难,分析了XML语言的技术特点,提出了一种基于半结构化数据的关联规则挖掘模式。该模式充分利用了半结构化数据源的自描述性、开放性和可扩展性方面的优势。 相似文献