首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 133 毫秒
1.
引入一种新的加权关联规则支持度和置信度的计算方法,并利用矩阵的存储结构提出一种新的加权关联规则挖掘算法,从而改进了加权频繁项集的挖掘效率.该算法在Apriori算法的基础上,对数据库仅需扫描一次,能很快地计算项集的支持度,大大减少了I/O次数,有效提高了加权频繁项集的生成效率.通过应用于超市捆绑销售,证明了该算法能有效地提取商品间的关联信息,有助于商品的销售.  相似文献   

2.
Apriori算法是关联规则挖掘的一个经典算法,它使用一种称作逐层搜索的迭代方法,用(k-1)项集来探索k项集。每探索一个k项集,Apriori算法都需要扫描一次完整数据库。不断扫描数据库是影响Apriori算法运行效率的主要原因。文中基于线性链表对Apriori算法提出了一种改进方法。通过对数据库进行转换,以缩小探索k-项集时扫描的数据库,提高算法运行效率。  相似文献   

3.
CR:一种逆向的关联规则挖掘算法   总被引:4,自引:0,他引:4  
引入与交易相关的有关概念,对传统关联规则挖掘的概念进行了扩展,并基于交易提出了一种关联规则挖掘算法,该算法从较长的交易入手,试图找出长的频繁项集,再确定它们的子项集,从而避免了组合爆炸问题。该算法对原数据库进行1次扫描,对压缩数据库进行了2次扫描,较Apriori算法减少了扫描次数,提高了挖掘效率。  相似文献   

4.
数据挖掘是指从大量数据中发现潜在、有用知识的过程。关联规则是数据挖掘的一个主要研究内容,而如何提高挖掘算法的效率是关联规则数据挖掘的核心问题。Apriori算法是关联规则挖掘的经典算法,但是在实际应用Apriori算法的时间空间开销都很大。针对Apriori算法的局限性,从实际应用出发提出了多最小支持度算法,一方面降低候选项目集中候选项的数量;另一方面减少扫描数据库的次数。这种算法不仅降低了I/O负荷,而且减少了时间开销,具有较高的效率。  相似文献   

5.
Apriori算法是经典的关联规则挖掘算法之一。该算法可以很好地挖掘关联规则,通过连接步和剪枝步从频繁项集中获取候选项集,但产生大量的候选项集,这就需要重复扫描数据库,大大增加算法运行时间。文中提出一种基于矩阵的改进算法,通过事务矩阵和候选项集项目矩阵相乘的矩阵操作来改进频繁扫描数据库的问题。事务数组的建立可以删除不能生成下一频繁项集的事务,删除不必要的项,针对频繁项集的产生过程优化Apriori算法的连接步和修剪步。在不同的数据集下通过实验验证改进算法不仅能准确地挖掘出频繁项集而且大大地缩短挖掘时间。  相似文献   

6.
关联规则挖掘技术目前被广泛应用于入侵检测系统中。关联规则挖掘算法之一的FP-growth算法在处理数值量的输入时需要二值化,使得准确率不高;而Fuzzy Apriori算法需要重复扫描数据库,效率较低。针对此问题,改进现有的FP-growth算法,提出模糊化FP-growth算法,从而提取模糊关联规则,用于N类异常数据的分类入侵检测。在KDDCup'99数据集上评估,结果表明对于数值量的输入,该方法应用于入侵检测准确率高于FP-growth算法,学习效率高于Fuzzy Apriori算法。  相似文献   

7.
《现代电子技术》2019,(19):90-94
传统Apriori挖掘算法需多次扫描数据库、多次连接频繁项集,导致挖掘效率较低,为此对Apriori挖掘算法加以改进,设计一种新的Apriori挖掘算法用于音乐节目分类。改进的Apriori挖掘算法采用莱特准则对音频数据进行野值与噪声平滑处理,改进Apriori挖掘算法的音频数据库映射令两个线性表分别负责音频数据存储和对应项存储,音频数据库扫描次数降为一次;改进Apriori挖掘算法的连接次数无需对不具备交运算能力的元素进行交运算操作,减少频繁项集连接次数。基于改进频繁项集Apriori挖掘算法挖掘频繁项集、生成音频数据关联规则,基于关联规则集构建分类器,实现音乐节目分类。实验结果显示,改进Apriori挖掘算法用于音乐节目分类的效率优势突出,准确度高。  相似文献   

8.
针对关联规则中Apriori算法的不足之处,提出两种基于矩阵的Apriori改进算法.改进算法充分利用矩阵这一工具,以大幅度减少扫描数据库的次数和计算成本,进而有效提高算法的运算效率.同时,通过实例应用和算法性能分析证明所提出的两种改进算法都是有效的关联规则挖掘方法,且比Apriori算法具有更好的性能.  相似文献   

9.
针对传统的Apriori算法在挖掘布尔型关联规则的频繁项集中需不断扫描数据库,在时间与空间上都存在很大的冗余,尤其在处理海量稠密数据时,算法性能急剧下降的问题,本文从减少对数据集的扫描次数入手对Apriori算法进行改进,提出一种采用项目编码方式挖掘频繁项集的算法。最后通过实验结果证明改进后的算法在支持度较小情况下,在执行时间上比经典的Apriori算法的具有较高的执行效率。  相似文献   

10.
本文对关联规则数据挖掘经典算法Apriori算法需要重复扫描数据库的不足提出了一种新算法。该算法在连接两个频繁(k-1)-项集时,对其事务标识符进行交计算,得到新的候选k-项集。避免了对数据库的频繁扫描,大大提高了算法效率。  相似文献   

11.
1 IntroductionKnowledge Discoveryin databaseis a newly useinfor-mation availably way that computer automatically pick upuseful information or knowledge fromhuge amounts of da-ta.KDD has been one of research hotspots in the field ofthe data base.Data minin…  相似文献   

12.
利用加权关联规则方法提取护理人员职场偏差行为问卷研究中的规则,样本包括539名护理人员.鉴于偏差行为影响因素重要性的不一致,基于传统的关联规则Apriori算法,设计并实现了加权关联规则的挖掘算法,应用于护理人员偏差行为的研究.实验表明,与Apriori算法相比,加权关联规则方法提取出更多的规则,并且可以增强某些规则的支持度和置信度,使这些规则更容易被发现,说明该方法是可行的.  相似文献   

13.
黄玉蕾  罗晓霞  林青 《电信科学》2015,31(11):85-90
提出了一种改进的Apriori关联规则挖掘算法,称为Apriori-BR。该算法首先通过扫描两次数据库建立各个频繁项目集到事务的倒排索引,并对倒排索引按照事务长度进行分组,然后在挖掘过程中,利用位运算加快子集的检测,并在必要时动态删除无效的低维事务。实验结果表明,相比于经典的Apriori算法和已有文献中的改进算法,本文所提的Apriori-BR算法显著提高了挖掘效率。  相似文献   

14.
针对关联规则挖掘中经典Apriori算法由于多次扫描数据、产生大量候选集及产生候选集时连接次数多等缺陷,导致效率较低。文中提出删除部分特殊事务,减少扫描数据次数。在生成候选k-项集前,对频繁k-1项集进行约简,减少连接次数和候选k-项集数,对Apriori算法进行改进。并将改进的Apriori算法用于试题分析中,得出试题之间的关联关系。实例表明,改进后的算法在效率上优于Apriori算法。  相似文献   

15.
关联规则挖掘Apriori算法的改进   总被引:2,自引:1,他引:1  
在介绍Apriori算法原理和实现过程的基础上,针对该算法存在的两个缺陷,即多次扫描事务数据库和产生大量的候选集,提出新的算法New_Apriori,该算法改变由低维频繁项目集到高维频繁项目集的多次连接运算,直接从1-频繁项目集产生高维频繁项目集,克服了Apriori算法的固有缺点,从而提高了运算效率.  相似文献   

16.
文章在分析关联规则和Apriori算法原理的基础上,针对Apriori算法扫描数据库时由于事务数过大,导致系统的I/O负载和CPU运算压力过大等弊端,提出一种主要针对大数据量情况下Apriori算法性能提升的改进算法。主要思想是通过抽样和事务压缩来减少算法需要扫描的事务数,进而提升算法的效率。同时,基于主流的weka开源数据挖掘工具实现了改进算法。实验结果表明了算法的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号