首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 123 毫秒
1.
典型关联规则挖掘算法的分析与比较   总被引:6,自引:0,他引:6  
关联规则的发现是数据挖掘的一个重要方面,目前许多研究人员正致力于关联规则的快速开采算法的研究。文中介绍了几种典型的开采大型事务数据库中所有关联规则的算法,特别针对算法过程中产生候选频繁项集的大小和所需扫描事务数据库的次数这两个影响关联规则挖掘效率的关键问题,分析各个算法采用的解决策略及相应的局限性,并比较它们的时间效率和空间效率。最后展望了关联规则挖掘算法的研究方向。  相似文献   

2.
采用频繁项目链表变换的频繁项目集挖掘算法   总被引:1,自引:0,他引:1  
频繁项目集的产生是关联规则挖掘的关键问题,经典的关联规则挖掘算法是通过对事务数据库的多次扫描实现的.最新的研究已经开始探索合适的数据结构以支持进行极少次数的事务数据库的扫描,进而减少关联规则挖掘过程中巨大的I/O开销以获得更高的效率.文中利用频繁项目链表的数据结构,给出了一种仅需扫描两次事务数据库的关联规则挖掘算法 ,称为FILLT算法.该算法采取分而治之策略,对频繁项目链表实施分割、变换来进行关联规则挖掘.文中最后对这一算法的效率进行了理论分析和实验验证.  相似文献   

3.
关联规则挖掘是数据挖掘领域中的一个非常重要的研究内容,其主要目标就是发现数据库中一组对象之间某种关联。频繁项集挖掘是关联规则挖掘的关键步骤,它在很大程度上决定了关联规则挖掘的效率。介绍了Apriori算法及其算法改进。该改进算法对剪枝步进行了优化,提高了连接效率,并且不断减小数据库的规模,去掉无效事务,减少了每次扫描数据库所花费的时间,提高了算法效率。经过试验论证,性能比原有算法提高,具有一定的实用性。  相似文献   

4.
一种基于MFP树的快速关联规则挖掘算法   总被引:1,自引:0,他引:1  
在关联规则挖掘FP-Growth算法的基础上,提出一种基于MFP树的快速关联规则挖掘算法。文中给出了MFP算法的工作原理。MFP算法能在一次扫描事务数据库的过程中,把该数据库转换成MFP树,然后对MFP树进行关联规则挖掘。MFP算法比FP-Growth算法减少一次对事务数据的扫描,因此具有较高的时间效率。  相似文献   

5.
在关联规则挖掘FP-Growth算法的基础上,提出一种基于MFP树的快速关联规则挖掘算法。文中给出了MFP算法的工作原理。MFP算法能在一次扫描事务数据库的过程中,把该数据库转换成MFP树,然后对MFP树进行关联规则挖掘。MFP算法比FP-Growth算法减少一次对事务数据的扫描,因此具有较高的时间效率。  相似文献   

6.
李晓虹  杨有 《计算机科学》2007,34(9):142-144
关联规则挖掘是数据挖掘的一个重要研究方向,其算法主要有Apriori算法和FP—growth算法,它们需要多次扫描事务数据库,严重影响算法的效率。为了减少扫描事务数据库的次数,本文提出一种基于线性链表(LinearLinker)的LL算法,它只需扫描事务数据库一次,把事务数据库转换为线性链表LL,进而对LL进行关联规则挖掘。实验表明,LL算法的时间开销明显优于Apriori算法和FP—growth算法,且LL算法通过定义备用候选频繁项目集,有效地支持了关联规则的更新挖掘。  相似文献   

7.
针对Apriori算法的主要问题,提出了关联规则挖掘的两种改进算法:高维分解法通过遍历事务数据库形成高维频繁项目集和关联规则,然后直接分解高维关联规则得到低维关联规则;前缀广义链表法先通过对事务数据库的遍历形成前缀链表,然后再次扫描事务数据库,遍历其前缀链表,根据判断每个事务是否与其中的一条路径完全或部分重合而找到关联规则。这两种算法均能极大地减少事务数据库的遍历和大规模候选序列集的产生,提高挖掘算法的效率,使得关联规则的产生简单化。  相似文献   

8.
关联规则挖掘是数据挖掘研究领域中的一个重要任务,旨在挖掘事务数据库中有趣的关联。Apriori算法是关联规则挖掘中的经典算法。然而Apriori算法存在着产生候选项目集效率低和频繁扫描数据等缺点。提出了一种新的Apriori的改进算法,该算法在生成k(k>1)项频繁集时,不需要重新扫描数据库,只是在生成1项频集时,才需要扫描事务数据库,有效地减少了对事务数据库的读操作,在时间复杂度上较经典的Apriori算法有更加优越的性能。  相似文献   

9.
关联规则挖掘算法研究   总被引:2,自引:0,他引:2       下载免费PDF全文
关联规则挖掘是数据挖掘的一个重要研究领域。针对经典Apriori算法频繁扫描事务数据库致使运行效率低下的缺点,在研究已有关联规则挖掘算法的基础上,提出一种改进的基于关系矩阵的关联规则挖掘算法。理论分析和实验结果均表明,所提算法是高效的和实用的。  相似文献   

10.
关联规则挖掘过程中,为了得到侯选项集的支持度,需要将候选项集与数据库中事务逐一进行比较,影响了算法的执行效率.针对该问题,提出一种基于数据立方体的关联规则挖掘算法ABDC.该算法结合了属性分组的思想,将生成的侯选项集进行编码后,利用数据库中事务的包含关系,在数据立方体中迅速查找到包含该侯选项集的所有事务在数据库中的出现频率,依次累加后根据最小支持量得到数据库中存在的频繁项集,不仅对事务数量的递增具有不敏感性,而且提高了算法的执行效率.实验结果表明,该算法对挖掘大量事务集中存在的关联规则是快速有效的.  相似文献   

11.
关联规则的几种开采算法及其比较分析   总被引:14,自引:0,他引:14  
关联规则的发现是数据开采的一个重要方面,目前有许多人正致力于关联规则的快速开采集法,本文介绍几种开采大型事务数据库中所有关联规则的算法,并比较它们的效率。  相似文献   

12.
约束性相联规则发现方法及算法   总被引:47,自引:0,他引:47  
文中研究了在大型事务7库中发现有约束条件的相联规则问题,提出了有效实现约束性相联规则发现的两种方法,过滤数据库算法Filtering和频繁项集生成算法Separate,这两种可以同时并有物方法比已有算法运算效率有显著性提高。  相似文献   

13.
We develop techniques for discovering patterns with periodicity in this work. Patterns with periodicity are those that occur at regular time intervals, and therefore there are two aspects to the problem: finding the pattern, and determining the periodicity. The difficulty of the task lies in the problem of discovering these regular time intervals, i.e., the periodicity. Periodicities in the database are usually not very precise and have disturbances, and might occur at time intervals in multiple time granularities. To overcome these difficulties and to be able to discover the patterns with fuzzy periodicity, we propose the fuzzy periodic calendar which defines fuzzy periodicities. Furthermore, we develop algorithms for mining fuzzy periodicities and the fuzzy periodic association rules within them. Experimental results have shown that our method is effective in discovering fuzzy periodic association rules.  相似文献   

14.
关联规则的发现是数据挖掘的一个重要方面,而数量关联规则的发现不同于传统的布尔型关联规则。属性值的离散映射是挖掘定量关联规则的一个重要环节,离散映射中属性值区间的划分粒度是影响数据挖掘质量的一个重要因素。该文介绍几种发现大型事务数据库中数量关联规则的算法,并对他们加以比较。  相似文献   

15.
王明  宋顺林 《计算机应用》2010,30(9):2332-2334
发现频繁项集是关联规则挖掘的主要途径,也是关联规则挖掘算法研究的重点。关联规则挖掘的经典Apriori算法及其改进算法大致可以归为基于SQL和基于内存两类。为了提高挖掘效率,在仔细分析了基于内存算法存在效率瓶颈的基础上,提出了一种发现频繁项集的改进算法。该算法使用了一种快速产生和验证候选项集的方法,提高了生成项目集的速度。实验结果显示该算法能有效提高挖掘效率。  相似文献   

16.
Mining association rules is an important task for knowledge discovery. We can analyze past transaction data to discover customer behaviors such that the quality of business decisions can be improved. Various types of association rules may exist in a large database of customer transactions. The strategy of mining association rules focuses on discovering large item sets, which are groups of items which appear together in a sufficient number of transactions. We propose a graph-based approach to generate various types of association rules from a large database of customer transactions. This approach scans the database once to construct an association graph and then traverses the graph to generate all large item sets. Empirical evaluations show that our algorithms outperform other algorithms which need to make multiple passes over the database  相似文献   

17.
运用关联规则发现方法对人事信息库进行数据挖掘,生成了对当前数据库有效的关联规则,为高校管理决策提供科学依据。但数据库的更新操作经常发生,原来有效的部分规则可能在更新后的数据库中会成为无效,原无效的部分规则也同样有可能会成为有效。文章提出了EPUA算法,有效解决了数据更新后关联规则的更新问题,对FUP2算法进行了补充和改进。  相似文献   

18.
关系数据库中模糊规则的快速挖掘算法   总被引:10,自引:0,他引:10  
陈宁  陈安  周龙骧 《软件学报》2001,12(7):949-959
关联规则和时序规则是数据挖掘的任务之一.在以往的算法中,规则通常用确定的数值或概念来表示,往往不具有实际意义,而且不容易被用户理解.研究了从大型关系数据库中挖掘模糊关联规则和模糊时序规则的问题.基于模糊集合的理论,提出了两个模糊关联规则的挖掘算法,然后把它们分别扩展为模糊时序规则的挖掘算法.用模糊概念表示的规则更符合人的思维和表达习惯,增强了规则的可理解性.  相似文献   

19.
关联规则挖掘是数据挖掘研究的重要分支。发现频繁项目序列集又是关联规则挖掘中的一个关键阶段。十几年来,许多发现频繁项目集的算法已经被提出。近几年来,人们更关注于在大型数据集中高效发现频繁项目集的算法研究,特别是在减少数据库的扫描次数、提高内存利用率等方面。该文提出一个称为DFISP的算法,它是基于数据分段扫描策略的,并且只需两次数据库扫描即可完成频繁项目序列集的生成。实验表明,DFISP算法是稳定而高效的。  相似文献   

20.
一种基于加权的高效关联规则挖掘算法的设计与实现   总被引:6,自引:2,他引:6  
文章研究了在大型事务数据库中挖掘加权关联规则的问题,给出了加权频繁模式树的定义,在挖掘算法MIN-WAL(O)和MINWAL(W)的基础上,提出了一种基于加权频繁模式树的加权关联规则挖掘算法-WFPTA,并做了相应的算法比较,试验结果表明算法WFPTA是有效的。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号