首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 109 毫秒
1.
基于十字链表的Apriori改进算法   总被引:5,自引:0,他引:5       下载免费PDF全文
针对Apriori算法中存在的不足,提出一种把事务数据库映射到十字链表中的改进算法。该算法可以减少连接数据库的次数及事务记录的扫描次数。Apriori算法与改进算法的性能对比分析表明,改进算法能有效提高执行效率。  相似文献   

2.
李晓虹  杨有 《计算机科学》2007,34(9):142-144
关联规则挖掘是数据挖掘的一个重要研究方向,其算法主要有Apriori算法和FP—growth算法,它们需要多次扫描事务数据库,严重影响算法的效率。为了减少扫描事务数据库的次数,本文提出一种基于线性链表(LinearLinker)的LL算法,它只需扫描事务数据库一次,把事务数据库转换为线性链表LL,进而对LL进行关联规则挖掘。实验表明,LL算法的时间开销明显优于Apriori算法和FP—growth算法,且LL算法通过定义备用候选频繁项目集,有效地支持了关联规则的更新挖掘。  相似文献   

3.
针对关联规则挖掘经典的Apriori算法多次扫描数据库,侯选项集数目多而引起的效率低下问题,本文提出了将Apriori算法与散列技术和自适应步长相结合的改进算法,算法压缩了侯选项集的数目以及减少了扫描数据库的次数.通过理论分析与实验结果表明,该算法与经典的Apriori算法相比较,效率上有明显的提高,特别是对大事务集,长事务集数据挖掘效果更为明显.  相似文献   

4.
王勇  张伟 《计算机科学》2008,35(7):170-172
传统的Apriori关联法则算法必须经过大量反复的数据库扫描才能产生候选项集,效率较低.提出一个改进的CBA(Classification Based Apriori)算法.此算法仅需扫描数据库一次,将数据库经过预处理后,再将事务数据库进行分类并保存分类结果,比较时可以不与所有事务记录进行比较,从而减少扫描数据库的次数与比较时间,且又能确保挖掘结果的完整性与正确性.  相似文献   

5.
针对Apriori算法存在的不足,提出了一种新的优化Apriori的方法。该方法通过优化频繁项集修剪策略,减少无效候选项集的产生;优化连接策略,减少连接次数,避免相同项目的多次重复比较;结合事务数据库逐步压缩技术,减少对无用事务的扫描次数。实验结果表明,经过优化的Apriori算法具有更好的运行效率。  相似文献   

6.
提出了一种基于聚类的挖掘关联规则Apriori改进算法,该算法只需扫描一次事务数据库,直接按事务项数生成聚类表,每次只需扫描部分聚类表就可生成频繁项集,减少了扫描数据库的次数和计算成本,从而有效提高挖掘关联规则的效率。  相似文献   

7.
关联规则挖掘搜索给定数据集中反复出现的数据模式,找到它们之间的相关性。分析了经典Apriori算法存在的时空效率低的缺点和数据形式对算法效率的影响。提出一种基于动态散列和事务压缩技术的改进,动态应用散列技术减小候选频繁项集的规模和数据库扫描次数,应用事务压缩技术缩小数据库中事务量的长度和总数,从而提高了算法的时间空间效率。与Apriori算法进行的比较验证了新算法的正确性与效率。  相似文献   

8.
为了进一步降低扫描数据库的次数和减轻内存负担,从而更好地提高挖掘频繁项集的效率,一种基于Apriori的优化算法(M-Apriori)被提出. 该方法通过构建频繁状态矩阵来存放项集的频繁状态,构建事务布尔矩阵来存放事务与项集的关系,此算法只需在初始化阶段扫描一次数据库产生初始的频繁状态矩阵和事务布尔矩阵,并在此基础上直接递推产生所有的频繁项集. 实验证明,与Apriori算法相比,M-Apriori算法具有更好的性能与效率.  相似文献   

9.
关联规则挖掘是数据挖掘研究领域中的一个重要任务,旨在挖掘事务数据库中有趣的关联。Apriori算法是关联规则挖掘中的经典算法。然而Apriori算法存在着产生候选项目集效率低和频繁扫描数据等缺点。提出了一种新的Apriori的改进算法,该算法在生成k(k>1)项频繁集时,不需要重新扫描数据库,只是在生成1项频集时,才需要扫描事务数据库,有效地减少了对事务数据库的读操作,在时间复杂度上较经典的Apriori算法有更加优越的性能。  相似文献   

10.
针对经典Apriori算法运行效率瓶颈问题,结合位集合占用内存空间少、逻辑运算快的特点,提出一种基于位集合的改进算法ABS.该算法通过一次数据库扫描,构建事务集位集合;采用位集合逻辑“与”运算和位统计操作确定频繁项集;改进连接和剪枝策略,采用位集合的逻辑“或”运算,统计运算结果重复出现次数,生成候选项集.挖掘实例数据库Northwind的频繁项集,对比Apriori算法,改进算法运行时间明显减少.该算法避免了数据库的重复扫描和繁琐的连接减枝操作,进一步提高了Apriori算法的运行效率.  相似文献   

11.
一种改进的Apriori算法   总被引:2,自引:0,他引:2       下载免费PDF全文
针对Apriori算法对数据库的扫描次数过多、系统的I/O负载大和产生大量的无关中间项集等弊端,提出了一种改进的Apriori算法。该算法通过加入用户兴趣项,减少候选项集的产生;打破了传统的算法实现步骤减少了数据库的扫描次数,降低了系统I/O负载;构建了用户兴趣度模型增加了算法生成强关联规则的可读性,提高了算法的效率。实验表明,改进的Apriori算法能有效地提高运行速度和效率。  相似文献   

12.
Apriori算法是关联规则挖掘的经典算法。但在面对海量数据集时,由于过多的磁盘读写操作,使算法的效率大大降低。本文提出了一种将数据集根据处理计算机的内存进行分割,使分割后的每一部分数据集能直接放入内存中,用Apriori算法找到局部的关联规则,再在所有找到的局部关联的基础上,使用遗传算法寻找全局关联规则的方法。由于大大减少了磁盘操作,在处理海量数据集时本方法效率优于传统Apriori算法。  相似文献   

13.
在关联规则挖掘算法中,Apriori由于多次对数据库进行扫描会产生较多的候选集,在多次扫描数据库的情况下容易产生I/O开销问题,并引起数据挖掘效率低.矩阵关联规则在数据挖掘过程中没有删除非频繁项集,致使存在较多的无效扫描,对于挖掘效率的提高也不明显.该文提出了一种改进的矩阵和排序索引关联规则数据挖掘算法,首先,删除不需...  相似文献   

14.
数据挖掘中关联规则在竞争情报系统中的应用   总被引:1,自引:0,他引:1  
李子方 《微计算机信息》2007,23(27):201-203
本文基于数据挖掘中经典的Apriori算法,提出了一种降低I/O开销以提高挖掘效率的改进算法,并针对外贸进出口行业的具体情况,开发出了基于J2EE平台的挖掘系统,为企业提供有价值的情报信息。  相似文献   

15.
赵静 《电脑开发与应用》2012,25(7):16-17,20
A priori算法是经典的关联规则挖掘算法,它利用逐层搜索的迭代方法完成频繁模式的挖掘工作,反复进行连接剪枝操作,思路简单易操作,但也伴随着产生庞大候选集,多次扫描数据库产生巨大I/O开销的问题,提出一种改进算法:基于矩阵的关联规则挖掘算法,同A priori算法比较,该算法只需扫描一遍数据库,就可直接查找k-频繁项集,尤其是当频繁项集较高的时候,该算法具有更高的执行效率,在大数据量的情况下更具有可行性。  相似文献   

16.
陈波  段成永  高秀娥 《测控技术》2016,35(1):123-126
针对关联规则数据挖掘的Apriori算法存在I/O负载大、计算速度慢和减枝过程中间结果多的问题,提出了一种基于矩阵加权的VMOApriori算法.该算法扫描一次数据库生成事务矩阵,并利用矩阵加权及其向量运算产生频繁项集,通过删减矩阵中事务及事务项压缩矩阵,减少了候选项集的冗余,加快了频繁项集的筛选速度.仿真表明,该算法降低了I/O负载,减少了中间结果数据量,提高了数据挖掘效率,验证了算法的有效性.  相似文献   

17.
为满足日益增长的海量数据挖掘需求,迫切需要设计一种能够在多台机器上运行的分布式关联规则挖掘算法。Apriori这种高度迭代算法在Hadoop平台上运行时每次迭代执行大量的磁盘I/O操作,大大影响并限制了算法的运行效率。本文利用Spark对分布式计算内置支持的特点,在Spark平台上设计并实现一种分布式关联规则挖掘算法,称为阶段式自适应挖掘算法(Staged Adaptive Apriori)。算法使用自适应的数据集部分处理的策略对频繁项集进行高效挖掘,在每次迭代前初步评估执行时间,并采用较为合适的方法来减少时间和空间的复杂性,是一种基于数据集性质的自适应关联规则挖掘算法。实验结果表明了算法的有效性。  相似文献   

18.
基于矩阵的关联规则挖掘算法   总被引:3,自引:0,他引:3       下载免费PDF全文
针对一些经典的关联规则算法进行分析,提出一种基于矩阵的高效关联规则挖掘算法。该算法把交易数据库转化为0-1矩阵形式,只需进行一次数据库搜索,使用逻辑运算方法发现频繁项集并计算它的支持计数,加快了频繁k项目集的验证速度,能大量减少所需的I/O次数,减小了存储空间。实验表明,新算法执行效率明显优于Apriori算法。  相似文献   

19.
传统的Apriori算法要多次扫描数据集,随着数据量的快速增长,传统的Apriori算法已经不能很好地适用于大数据分析,针对该情况设计了IPApriori算法。首先通过剪枝策略设计了一种适用于多维数据的IApriori算法,再将IApriori算法与Hadoop分布式框架相结合,实现了多维关联规则挖掘算法的并行化。将IPApriori算法运用到手机用户行为预测关联分析中,分析影响手机用户行为的一些主要因素,挖掘出手机用户行为与年龄维度、性别维度、时间维度、地点维度和手机品牌维度属性之间可能存在的某种关联。最后通过实验证明,算法的并行化和建立结构的方法可以降低系统的I/O负荷,提高算法的执行效率。  相似文献   

20.
李莎  顾巧论  周莹莹 《计算机科学》2012,39(105):331-334,369
针对R/M集成供应链的风险的特点提出Apriori算法进行预测,首先通过分析其风险的组成特性,建立风险数据库,提取风险数据库的相关信息,应用Apriori算法进行处理,通过找出风险发生的关联性找出风险的发生规律。利用改进候选项提取的方法减小Apriori算法的空间复杂度以提高运行效率。分析Apriori算法的计算结果,发掘风险事件与风险结果间的关联规则,解析结果,完成对R/M集成供应链的风险预测。通过仿真实验对算法进行了验证,结果表明该方法是可行的。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号