首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 46 毫秒
1.
关联规则的发现是数据挖掘中的一个重要问题,其核心是频繁模式的挖掘,通常采用的APriori算法要多次扫描数据库并产生大量的候选项集,开销很大。本文采用基于布尔矩阵关联挖掘的算法,只需扫描一次数据库而且不需要链接产生候选项集,从而提高算法的效率。并通过实例说明了它是一种有效的关联规则挖掘方法。  相似文献   

2.
何建忠  吕振俊 《计算机工程》2008,34(17):56-58,61
针对传统数据挖掘算法的不足,提出基于两个矩阵的优化关联规则挖掘算法.该算法对事务数据库进行一次扫描,将其转换成两个用于存放逻辑数据的矩阵,并保留项目间的关联信息.对两个矩阵进行挖掘,基于矩阵MA得到频繁1-项集和频繁2-项集,基于矩阵MB得到最大频繁项集,其他频繁k-项集基于两个矩阵和已得频繁集获取.该算法极大减少了候选频繁集数量,挖掘过程采用逻辑运算.实验结果证明了其可行性和高效性.  相似文献   

3.
一种基于矩阵的多值关联规则的挖掘算法   总被引:2,自引:0,他引:2  
关联规则是数据挖掘研究的主要模式之一,其中布尔型关联规则的挖掘已经有比较成熟的系统和方法,而多值关联规则的挖掘则不然。本文提出的QARMM算法利用矩阵存储数据,将频繁项目集的产生过程转化为项目集的关系矩阵中向量的运算过程,同时克服了SLIG算法和矩阵算法不能挖掘多值关联规则的弱点,只需运行一次便可挖掘出所有关联规则。实验证明,在等价的数据集上挖掘关联规则,QARMM算法比Apriori算法具有更高的效率。  相似文献   

4.
基于关联规则挖掘中的Apriori算法,在一定条件下,进行局部改进来提高挖掘的时间效率。这种改进本身并不会需要多大的系统开销,但是可以使算法在某些情况下运行得更快些。  相似文献   

5.
Apriori算法是经典的频繁项目集生成算法,在数据挖掘界起着里程碑的作用。但是该算法要求多次扫描可能非常大的交易数据库。文章在Apriori算法的基础上,提出了一种改进的关联规则挖掘算法-GBARM。该算法能够使得每次扫描的事务数大大减少,并且能够逐步减小候选k-项集的规模,从而改善算法的性能。  相似文献   

6.
何建忠  吕振俊 《计算机工程》2008,34(17):56-58,6
针对传统数据挖掘算法的不足,提出基于两个矩阵的优化关联规则挖掘算法。该算法对事务数据库进行一次扫描,将其转换成两个用于存放逻辑数据的矩阵,并保留项目间的关联信息。对两个矩阵进行挖掘,基于矩阵MA得到频繁1-项集和频繁2-项集,基于矩阵MB得到最大频繁项集,其他频繁k-项集基于两个矩阵和已得频繁集获取。该算法极大减少了候选频繁集数量,挖掘过程采用逻辑运算。实验结果证明了其可行性和高效性。  相似文献   

7.
基于数组的关联规则挖掘算法   总被引:12,自引:0,他引:12  
孟祥萍  钱进  刘大有 《计算机工程》2003,29(15):98-99,109
提高频繁项集挖掘算法的效率是关联规则挖掘研究的一个重点领域。文章提出了基于数组的关联规则挖掘算法,只需要扫描数据库1次,通过不断减少数据库中的事务个数,并且利用一维数组对候选2-项集进行计数来提高挖掘效率。实验表明,该文所提出的算法效率比经典Apriori算法快2~3倍。  相似文献   

8.
基于矩阵的关联规则挖掘算法   总被引:3,自引:0,他引:3       下载免费PDF全文
针对一些经典的关联规则算法进行分析,提出一种基于矩阵的高效关联规则挖掘算法。该算法把交易数据库转化为0-1矩阵形式,只需进行一次数据库搜索,使用逻辑运算方法发现频繁项集并计算它的支持计数,加快了频繁k项目集的验证速度,能大量减少所需的I/O次数,减小了存储空间。实验表明,新算法执行效率明显优于Apriori算法。  相似文献   

9.
一种基于关联规则挖掘的改进算法   总被引:1,自引:0,他引:1  
在介绍关联规则的QAIS算法的基础上,指出了该算法的不足之处,分析了项集的构成特点,提出了一种新的存储项集的数据结构,进而形成了QAIS算法改进算法,谊算法能够处理较大的数据集,增强了算法的适应柱。  相似文献   

10.
频繁项集挖掘是关联规则挖掘的核心部分,目前大多数关于关联规则挖掘的研究都集中于如何提高频繁项集挖掘的效率,然而在实际应用中,决策者面对的是最终从频繁项集中生成的规则集,因此优化规则的生成过程及生成规则同样值得重视。本文提出频繁项集的子集树这一模式来生成关联规则,不仅简化规则的生成过程还可缩小决策者面对的规则集,更便于规则的增量更新。  相似文献   

11.
为了有效提高关联规则挖掘算法处理数据库的效率,在研究基于矩阵的关联规则挖掘算法的基础上,提出了改进的关联规则挖掘算法DMApriori,并选取程序模拟超市购物产生的4个试验数据集,应用DMapriori算法对该数据集进行了关联规则挖掘;实验结果表明,该算法能平均提高关联规则挖掘时间20%;在计算数据库中的频繁项集时,通过有效裁剪布尔矩阵,使算法逐层扫描的数据量大大减少,并且对每个项集计数时,只扫描部分数据,提高了关联规则挖掘算法的性能。  相似文献   

12.
数据挖掘中关联规则的改进算法及其实现   总被引:8,自引:9,他引:8  
杨健兵 《微计算机信息》2006,22(21):195-197
在Apriori算法基础上,提出了基于树数据结构的关联规则改进算法。由于该算法只需对交易数据库进行一次检索,故能大量减少所需的I/O次数,提高了系统的性能。  相似文献   

13.
针对多标签文本分类问题,提出基于频繁项集的多标签文本分类算法——MLFI。该算法利用FP-growth算法挖掘类别之间的频繁项集,同时为每个类计算类标准向量和相似度阈值,如果文本与类标准向量的相似度大于相应阈值则归到相应的类别,在分类结束后利用挖掘到的类别之间的关联规则对分类结果进行校验。实验结果表明,该算法有较高的分类性能。  相似文献   

14.
基于数组的关联规则挖掘算法   总被引:4,自引:1,他引:3  
文章提出了基于数组的关联规则挖掘算法,只需要扫描数据库1次,利用数组的结构特性来提高挖掘效率。  相似文献   

15.
基于图的关联规则改进算法   总被引:1,自引:0,他引:1  
关联规则挖掘是数据挖掘研究的最重要课题之一。基于图的关联规则挖掘DLG算法通过一次扫描数据库构建关联图,然后遍历该关联图产生频繁项集,有效地提高了关联规则挖掘的性能。在分析该算法基本原理基础上,提出了一种改进的算法—DLG#。改进算法在关联图构造同时构造项集关联矩阵,在候选项集生成时结合关联图和Apriori性质对冗余项集进行剪枝,减少了候选项集数,简化了候选项集的验证。比较实验结果表明,在不同数据集和不同支持度阈值下,改进算法都能更快速的发现频繁项集,当频繁项集平均长度较大时性能提高明显。  相似文献   

16.
在对关联规则中的Apriori算法进行了深入研究的基础上,提出了基于矩阵结构的关联规则挖掘算法.由于这个算法只需要对交易数据库进行一次搜索,给出了一种简单有效的逐步缩减交易数据库的方法,能大量减少所需的I/O次数,因此提高了Apriori算法的效率,并改进了数据挖掘算法的性能.  相似文献   

17.
基于向量内积的关联规则挖掘算法研究   总被引:6,自引:1,他引:5  
针对近年来研究较多的数据关联挖掘问题,论文将向量内积引入到该领域,并通过合理分配数据存储结构来提高数据库频繁项集的生成效率。研究表明,该方法不仅算法简单、只需扫描一次数据库,而且还具有动态剪枝、不保存中间候选项和节省大量内存空间等优点。在处理超大型数据库和分布式数据库方面均能得到较好的应用。  相似文献   

18.
文中提出了一种挖掘最小规则集的算法,通过对最小规则集运用覆盖运算,能够得到所有的关联规则。最小规则集中的规则称为基规则。所有的关联规则都可以通过覆盖最小的关联规则集得到。  相似文献   

19.
赵静 《电脑开发与应用》2012,25(7):16-17,20
A priori算法是经典的关联规则挖掘算法,它利用逐层搜索的迭代方法完成频繁模式的挖掘工作,反复进行连接剪枝操作,思路简单易操作,但也伴随着产生庞大候选集,多次扫描数据库产生巨大I/O开销的问题,提出一种改进算法:基于矩阵的关联规则挖掘算法,同A priori算法比较,该算法只需扫描一遍数据库,就可直接查找k-频繁项集,尤其是当频繁项集较高的时候,该算法具有更高的执行效率,在大数据量的情况下更具有可行性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号