首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 78 毫秒
1.
对关联规则挖掘Apriori算法的进一步改进   总被引:4,自引:0,他引:4  
本文对关联规则挖掘问题进行了介绍。并在分析研究了关联规则挖掘Apriori算法厦其若干改进算法的基础上,对Apriori算法做了进一步地改进,提出了RIAprlori算法。改进后的算法采用事务压缩的方法时事务集进行了更大幅度的压缩。减小了不必要的开销,从而提高了挖掘速度。  相似文献   

2.
挖掘关联规则中对Apriori算法的一个改进   总被引:12,自引:6,他引:12  
文章针对关联规则中的Apriori算法进行了深入研究,提出了Apriori-I算法。由于这个算法只需要对交易数据库进行一次搜索。能大量减少所需的I/O次数,且内存开销适中,因此同其他关联规则算法相比具有快速的优点.适用于大型交易数据库。使用合成数据作试验表明这个算法尤其对大型数据库的性能优于先前已有的一些关联规则算法。  相似文献   

3.
在关联规则理论的基础上,通过对现有算法的效率分析,在原有A研ori关联规则挖掘算法的基础上,从减少事务数据库中扫描记录量入手,提出一个改进的快速关联规则挖掘算法Fast_Apriori。利用候选项集和频繁项集中的结果对数据库中的记录进行筛选,对不包含候选项集中任何项集的记录和不包含在候选项集中的事物记录直接删除,减少扫描的记录数,提高整个算法的效率。  相似文献   

4.
互联网作为一个国家教育事业的基础设施,是人们获取知识的一个重要途径。传统网络服务系统功能简单,服务单一,网络利用率不足。文章改进关联规则Apriori算法并应用于网络数据处理中,提高数据利用率。  相似文献   

5.
针对传统Apriori算法的不足之处,提出两种Apriori改进算法,分别基于构造辅助表和项集求交集策略。改进算法大幅度减少扫描数据库的次数,缩减对不必要事务的扫描时间,显著提高频繁项集的生成效率,从而使算法达到更高的运算效率。实验结果表明,两种改进算法都是有效的关联规则挖掘方法,且比Apriori算法性能更优,亦为关联规则挖掘研究提供了一些科学可行的新思路。  相似文献   

6.
基于经典Apriori算法的加权关联规则挖掘算法New-Apriori存在3个问题,需要多次扫描数据库,权值定义不合理和权值的引入导致Apriori基本性质不再成立。为了解决这些问题,采用将矩阵和加权关联规则算法相结合的方法,该改进算法具有只需要扫描一次数据库,权值的定义既考虑到了权重大的项目,也没有忽略频繁出现而权重小的项目,并引入K-项支持期望作为减枝的依据的特点。  相似文献   

7.
《信息技术》2015,(9):162-165
在当前处理大数据集的需求下,针对关联规则数据挖掘传统Apriori算法的不足,提出基于云计算平台并引入矩阵概念的一种改进算法,通过改进以减少传统Apriori算法的I/O负担严重、候选集数量巨大等问题,使其更好地适应大数据的频繁项集数据挖掘。  相似文献   

8.
针对关联规则中Apriori算法的不足之处,提出两种基于矩阵的Apriori改进算法.改进算法充分利用矩阵这一工具,以大幅度减少扫描数据库的次数和计算成本,进而有效提高算法的运算效率.同时,通过实例应用和算法性能分析证明所提出的两种改进算法都是有效的关联规则挖掘方法,且比Apriori算法具有更好的性能.  相似文献   

9.
关联规则挖掘是数据挖掘技术的一个重要分支,其中Apriori算法是最经典和最有影响力的算法。本文在讨论和分析了关联规则挖掘的基本概念后,提出了一种减少扫描数据库次数的改进算法。改进后的算法分析证明,它可以有效地提高数据挖掘的性能。  相似文献   

10.
基于项集特性的关联规则挖掘中Apriori算法的改进   总被引:2,自引:0,他引:2  
提出一个改进Apriori的算法IApr,利用事务数据库的事务数相对于项集的项的个数而言要大得多这一特点,采用线性存储结构,并结合推出并证明的项集特性,考虑候选频繁项目集的各个项的应满足的条件,只需扫描一次事务数据库,有效减少了生成候选频繁项集的数目,从数据扫描量、搜索空间、时间复杂度上分析都提高了算法效率。  相似文献   

11.
本文描述了数据挖掘的过程,对关联规则挖掘的核心算法及常用的优化方法进行了研究,最后通过一个例子介绍了关联规则分析在数据挖掘中的应用,并展望了数据挖掘的发展趋势及热点研究.  相似文献   

12.
针对关联规则挖掘中经典Apriori算法由于多次扫描数据、产生大量候选集及产生候选集时连接次数多等缺陷,导致效率较低。文中提出删除部分特殊事务,减少扫描数据次数。在生成候选k-项集前,对频繁k-1项集进行约简,减少连接次数和候选k-项集数,对Apriori算法进行改进。并将改进的Apriori算法用于试题分析中,得出试题之间的关联关系。实例表明,改进后的算法在效率上优于Apriori算法。  相似文献   

13.
关联规则增量式快速更新方法的研究   总被引:1,自引:2,他引:1  
随着最小支持度的不同,就会产生不同的频繁项目集,而频繁项目集的发现又是一个高花费的过程。如何实现不同最小支持度下频繁项目集的更新就显得尤为重要。提出了一种新的增量更新策略,用来解决这一关联规则的高效维护问题。  相似文献   

14.
关联规则挖掘Apriori算法的改进   总被引:2,自引:1,他引:1  
在介绍Apriori算法原理和实现过程的基础上,针对该算法存在的两个缺陷,即多次扫描事务数据库和产生大量的候选集,提出新的算法New_Apriori,该算法改变由低维频繁项目集到高维频繁项目集的多次连接运算,直接从1-频繁项目集产生高维频繁项目集,克服了Apriori算法的固有缺点,从而提高了运算效率.  相似文献   

15.
针对Apriori算法与FP-Growth算法在最大频繁项集挖掘过程中存在的运行低效、内存消耗大、难以适应稠密数据集的处理、影响大数据价值挖掘时效等问题,该文提出一种基于邻接表的最大频繁项集挖掘算法。该算法只需遍历数据库一次,同时用哈希表对邻接表进行辅助存储,减小了遍历的空间规模。理论分析与实验结果表明,该算法时间与空间复杂度较低,提高了最大频繁项集挖掘速率,尤其在处理稠密数据集时具有较好的优越性。  相似文献   

16.
关联规则是Web挖掘中一个重要的研究领域。为了挖掘出隐藏在数据间的相互关系,将关联规则的概念引入到Web挖掘系统中,把用户的访问路径以关联规则的形式表现出来。基于Apriori算法的思想,给出了适合Web挖掘用户访问的新Apriori算法规则及其模式,最后将结果在一些较简单的网页上进行了验证,取得了较好的应用效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号