共查询到19条相似文献,搜索用时 65 毫秒
1.
2.
分析了交易 (事务 )数据库中的数据结构特点 ,提出了在交易数据库中关联规则采掘的一个预处理过程 ,并且实现了该过程。通过预处理使得处理后的数据库记录个数减少了 ,从而在一定程度上提高了关联规则采掘的效率 相似文献
3.
4.
文章分析了交易数据库中关联规则的不足,提出了一种带有空间性约束的关联规则模型,分析了模型的性质并且通过扩展 Apriori算法实现了该模型 相似文献
5.
自上而下的关联规则采掘方法 总被引:1,自引:0,他引:1
1.前言在数据集中采掘关联规则是数据采掘的一个重要内容,[2]中提出了一种自底向上的数据采掘方法,即把数据集的各个属性从概念层次的最底层向高层进行“泛化”,但这种方法有二个缺点:首先,它的每一层都有一个阈值,但这些阈值之间是密切相关的;并且,对于不同数据集,这些阈值之间的关系也不同。在数据采掘的过程中,要调整这些阈值以取 相似文献
6.
关系数据库中多层次关联规则的采掘及其实现 总被引:3,自引:0,他引:3
讨论了在关系数据库中进行多层次的关联规则采掘的概念和在关系数据库中的实现方法。提出并实现了利用关系数据库的特点,高效地得到满足要求的多层次关系规则,并进行了必要的讨论和总结。 相似文献
7.
8.
基于集合运算的关联规则采掘算法 总被引:3,自引:0,他引:3
1 引言近年来,随着商业、政府和科学数据库的急剧增长和存贮设备的不断升级,给我们带来了大量的数据。面对这“堆积如山”的数据,用传统的数据分析手段无法理解并有效地利用它们。人们希望找到能够自动地、智能地理解分析它们的方法,于是就出现了数据采掘技术。它的提出为我们有效识别出存在于这些数据中的有效的、新颖的、具有潜在效用的乃至最终可理解的模式提供了可靠的科学方法,并成为当今国际人工智能和数据库等领域新兴且热门的研究课题。在事务数据库中发现关联规则是由R·Agrawal等人首先提出的。目前己成为数据采掘领域中的一个非常重要的研究课题。有一个关联规则的例子就是“面包牛奶(20%,80%)”,其直观意义为在所有的购买交易中,同时购卖面包与牛奶的概率为20%,在所有购卖面包的交易中有80%交易同时也购买牛奶。关联规则的应用主要包括顾客购物分析、目录设计、商品广告邮寄分析、追加销售、仓储规划、网络故障分析等。 相似文献
9.
采掘关联规则的高效并行算法 总被引:32,自引:1,他引:32
采掘关联规则是数据采掘领域的一个重要问题。文中对采掘关联规则问题进行了简单的回顾,给出了一种提高顺序采掘关联规则效率的方法;分析了已有并采掘关联规则算法的优缺点;设计了一个效率较高的并行采掘关联规则的算法PMAR;并与其它相应算法进行了比较,实验证明,算法PMAR是有效的。 相似文献
10.
一种多概念层数值关联规则采掘方法 总被引:2,自引:0,他引:2
目前,数据采掘已成为人工智能、数据库等领域的重要研究课题。数据采掘是从大量的数据中自动高效地提取未知的、可用的、可信的、可理解的知识的数据处理新技术。为了便于理解,数据采掘的结果可以用人们熟悉的概念来表示。某一领域中的概念按其内涵和外延往往形成一定的关系。在数据采掘中,主要有概念格和概念层次两种描述这种关系的方法,概念格主 相似文献
11.
Mining association rules from large databases is very costly. We propose to develop parallel algorithms for this task on shared-memory multiprocessor (SMP). All proposed parallel algorithms for other paradigms follow the conventional level-wise approach: they need as many iterations as the length of the maximum large itemset. To make matter worse, they impose a synchronization in every iteration which would cause serious I/O contention on shared-memory parallel system. An adaptive asynchronous parallel mining algorithm APM has been proposed for SMP. All processors generate candidates dynamically and count itemset supports independently without synchronization. Two optimization techniques have been proposed for the reduction of database scanning and the number of candidates. The algorithm APM has been implemented on a Sun Enterprise 4000 shared-memory multiprocessor with 12 nodes. The experiments show that the optimizations have very good effects and APM has a substantial lead in performance over other proposed level-wise algorithms. 相似文献
12.
13.
挖掘关联规则的并行算法 总被引:3,自引:0,他引:3
从大型数据库中挖掘关联规则是数据挖掘中一个重要的课题 .从挖掘要求的时间和空间上看 ,传统的顺序算法已很难适应于现实中不断增大的数据库规模 .而研究和发展高性能、可扩展的并行算法对解决这一问题就显得十分必要 .本文介绍了挖掘关联规则一些主要的并行算法 ,并对它们进行了一定分析 ,指出了发展并行算法要考虑的一些问题 . 相似文献
14.
15.
在研究关联规则挖掘算法的基础上,对并行关联规则算法进行了比较全面的分析,并给出了并行数据挖掘的计算框架。提出了一个以计算服务器为中心节点的并行挖掘算法,可以发挥各局部节点的优势,无需各局部节点进行通信,减少了各局部节点的通信负荷。通过理论分析和实验数据验证,该算法具有较好的可扩展性和海量处理能力,特别是在节点数目较多的情况下更显示出优势。 相似文献
16.
关联规则挖掘是数据挖掘的一个重要分支,但随着数据的快速增长,传统关联规则挖掘算法不能很好地适应大数据的要求,需要在分布式、并行计算的平台上寻找突破。Spark是专门为大数据处理而设计的一个适合迭代运算的并行计算模型,相比MapReduce具有更高效、充分利用内存、更适合迭代计算和交互式处理的优点。对已有的基于Spark的并行关联规则挖掘算法进行了分类和综述,并总结了各自的优缺点和适用范围,为下一步的研究提供参考。 相似文献
17.
本文提出了一种基于XML数据库的关联规则分析模型。在对XML数据库和XQuery查询语言作了简要介绍以后,提出了基于XML数据库的关联规则分析的研究思想,并描述了基于这个思想进行关联规则分析的模型。最后,通过一个例子说明了如何利用这个模型进行关联规则分析的具体过程。 相似文献
18.
空间关联规则的双向挖掘 总被引:9,自引:0,他引:9
空间数据库中关联规则挖掘不仅需要考虑关系元组属性之间的关系——纵向关系,更需要挖掘元组之间的关系——横向关系,如相邻、相交、重叠等。本文通过分析空间数据库的存储模式,借鉴事务数据库关联规则的挖掘方法,对空间关联规则进行完整定义,并对规则的兴趣度度量进行探讨。根据挖掘的方向将空间数据挖掘归纳为纵向挖掘、横向挖掘、双向挖掘。在双向挖掘中,提出一种新算法,该算法根据挖掘任务进行约束,缩小挖掘空间,然后通过空间计算将空间关系转化为非空间关系,经过多次循环,获取非空间项集,进而挖掘出空间关联规则。据此提出空间数据双向挖掘工作流程,并通过实例进行了验证。 相似文献
19.
一种改进的相联规则提取算法 总被引:3,自引:1,他引:3
相联规则的提取是数据挖掘的一个重要方面。Apriori算法是提取相联规则的经典算法,效率较高。AprioriPro算法是对Apriori算法的改进,它利用大项集生成过程中的中间结果对数据库进行过滤,从而加快候选项集的计数速度,提高了整个算法的效率。该文在AprioriPro算法的基础上,首先对其基本理论进行扩展并加以证明,提出了AprioriPro2算法。该算法相对于AprioriPro算法能更多地去掉数据库中的无效元组,从而进一步提高了算法的效率。 相似文献