首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 78 毫秒
1.
通过对Apriori算法挖掘过程进行分析,提出一种基于压缩矩阵的Apriori改进算法。该算法通过压缩矩阵和减少扫描次数来提高挖掘的速度和减少数据库的I/O操作时间的开销,有效提高了关联规则的挖掘效率。并用实例说明该算法是一种有效的关联规则挖掘方法。  相似文献   

2.
针对关联规则中Apriori算法存在的缺点,提出了一种基于布尔矩阵约简的Apriori改进算法。在该算法中,将事务数据库转换为布尔矩阵,并在矩阵最后增加1行2列,用来记录相同事务的个数和矩阵行与列中"1"的个数。将矩阵各列元素按支持数升序排列,使得算法在压缩过程中减少了扫描矩阵各列的次数,缩短了算法的运行时间。另外,为了提高算法的存储空间利用率,增加了删除非频繁项集的操作。实验结果和性能分析表明,相比现有的算法,改进后的算法具有更好的性能,能够有效地提高算法执行效率。  相似文献   

3.
基于矩阵的Apriori算法的优化   总被引:1,自引:0,他引:1  
在数据挖掘中关联规则挖掘是很重要的一个方面,而Apriori算法是进行关联规则挖掘的经典算法。本文首先分析了经典Apriori算法,然后利用矩阵的思想对其改进,并利用事务压缩的思想对矩阵进行压缩。改进后的算法明显提高了Apriori算法的效率。  相似文献   

4.
基于矩阵压缩的Apriori算法改进的研究   总被引:2,自引:0,他引:2       下载免费PDF全文
Apriori算法是利用关联规则进行数据挖掘的一种经典算法,但其具有产生大量候选项集和多次扫描数据库的缺点。鉴于此,提出了一种基于压缩矩阵的Apriori改进算法,通过扫描一次数据库,将其转化为布尔事务矩阵,按照相关性质对事务矩阵进行压缩,以减少算法的运算量。实验结果表明,改进算法在性能上得到了明显提高。  相似文献   

5.
 Apriori算法在搜索频繁项集过程中,通常需要对数据库进行多次的重复扫描和产生大量无用的候选集,针对此问题提出一种基于矩阵约简的Apriori改进算法。该算法只需扫描一次数据库,将数据库信息转换成布尔矩阵,根据频繁k-项集的性质推出的结论来约简数据结构,有效地降低无效候选项集的生成规模。通过对已有算法的对比,验证该算法能有效地提高挖掘频繁项集的效  相似文献   

6.
纪怀猛 《计算机工程》2013,(11):183-186
捕要:Apriori算法在关联规则挖掘过程中需要多次扫描事务数据库,产生大量候选项目集,导致计算量过大。为解决该问题,提出一种基于频繁2项集支持矩阵的Apriori改进算法,通过分析频繁k+1项集的生成机制,将支持矩阵与频繁2项集矩阵相结合实现快速剪枝,并大幅减少频繁k项集验证的计算量。实验结果表明,与Apriori算法和ABTM算法相比,改进算法明显提高了频繁项集的挖掘效率。  相似文献   

7.
挖掘关联规则是数据挖掘中一个重要的课题,产生频繁项集是其中的一个关键步骤.文章提出了一种基于矩阵压缩的Apriori优化算法,并将该算法与Apriori算法进行了比较.实验表明与Apriori算法相比,新算法的效率较好.  相似文献   

8.
传统数据挖掘关联规则Apriori算法直接移植到云计算平台,数据挖掘效率虽然有了数量级的提升,但由于需要频繁地扫描事务数据库,增加了系统I/O、内存和通信的开销。提出一种基于矩阵的并行关联规则算法Apriori_MMR,该算法结合了数据划分的思想进行并行化改进,简化了生成候选项的连接步骤,仅需对事务数据库扫描两次,同时在计算过程中还能对事务进行压缩从而进一步提高了算法的性能。通过两种算法在不同数据规模下算法性能对比分析实验和两种算法在相同数据集不同节点数对比实验,共同验证了Apriori_MMR的运算效率至少要比Apriori_MR高出两倍左右,且设置的支持度阈值越小,效果愈明显。  相似文献   

9.
10.
数据挖掘中的关联规则挖掘能够发现大量数据中项集之间有趣的关联或相关联系,特别是随着大量数据不停地收集和存储,从数据库中挖掘关联规则就越来越有其必要性。通过对关联规则挖掘技术及其相关算法Apriori进行分析,发现该技术存在的问题。Apriori算法是关联规则挖掘中的经典算法。对Apriori算法做了改进。借助0—1矩阵给出了计算项集的支持度计数的更快方法,同时还简化了Apriori算法中的连接和剪枝操作,从而在时间和空间上提高了Apriori算法的效率。  相似文献   

11.
该文分析与研究了Apriori算法,指出其在实用中存在的主要问题。鉴于此,该文提出了一种改进的关联规则挖掘算法,使其可以有效地压缩数据规模,并给出了改进后的关联规则算法描述。最后将其应用于课程相关性分析,得到了有益于课程设置挖掘结果。实验结果表明了算法性能优良,提高了数据挖掘执行的效率。  相似文献   

12.
基于Apriori算法改进的关联规则提取算法   总被引:9,自引:2,他引:9  
通过对Apriori算法的基本思想和性能的研究分析,认为Apriori算法存在一些不足。并且根据这些不足提出了相应的改进算法对Apriori算法进行优化,从而得到一种改进的Apriori算法,与原算法相比运算效率大大提高。  相似文献   

13.
关联规则算法是数据挖掘的核心。本文首先介绍了关联规则的定义,接着在现有Apriori算法的基础上分析了存在的不足,并提出了一个关联规则算法的改进模式,从而提高Apriori算法的效率。  相似文献   

14.
关联规则算法是数据挖掘的核心。本文首先介绍了关联规则的定义,接着在现有Apfiori算法的基础上分析了存在的不足,并提出了一个关联规则算法的改进模式,从而提高Apriori算法的效率。  相似文献   

15.
一种基于压缩矩阵的Apriori算法改进研究   总被引:1,自引:0,他引:1  
罗丹  李陶深 《计算机科学》2013,40(12):75-80
针对已有基于矩阵的Apriori算法存在的问题,提出了一种改进的基于压缩矩阵的Apriori算法。算法进行了以下方面的改进:增加了两个数组,分别用于记录矩阵行与列中1的个数,使得算法在压缩矩阵时减少了扫描矩阵的次数;在压缩矩阵中,通过增加删除不能连接的项集和非频繁的项集的操作,使得矩阵压缩得更小,提高了空间效率;改变了删除事务列的条件和算法结束的条件,以减少挖掘结果的误差和算法循环的次数。算法性能分析和实验分析证明,改进后的算法能有效地挖掘频繁项集,并且比现有的算法具有更高的计算效率。  相似文献   

16.
关联规则挖掘的矩阵算法   总被引:19,自引:0,他引:19  
关联挖掘作法中的Apriori算法提供了一种根据查找频繁项集来发现数据集中的关联规则的方法,这种算法思路简单易于实现;但在由低次频繁项集生成高次频繁项集时需反复查找数据库,在效率上存在一定的欠缺,在寻找高次频繁项集时尤为明显,文章提出了一种新的关联规则挖掘算法:矩阵算法。同Apriori算法相比较,该算法能直接查找高次频繁项集,可以有效地屏蔽Aptiori算法性能瓶颈试验结果表明,当频繁项级较高时该算法比Apriori具有更高的执行效率和性能,并具有良好的可行性。  相似文献   

17.
基于十字链表的Apriori改进算法   总被引:5,自引:0,他引:5       下载免费PDF全文
针对Apriori算法中存在的不足,提出一种把事务数据库映射到十字链表中的改进算法。该算法可以减少连接数据库的次数及事务记录的扫描次数。Apriori算法与改进算法的性能对比分析表明,改进算法能有效提高执行效率。  相似文献   

18.
深入研究关联规则算法, 针对Apriori算法瓶颈问题提出了一种改进算法, 该算法在构建向量矩阵的基础上, 只需要扫描一次事务数据库, 通过优化连接和剪枝, 提高了算法的运行效率. 研究和实验表明, 改进后的算法在大规模的事务数据库中, 较Apriori算法有明显的优势.  相似文献   

19.
基于消费行为的Apriori算法研究   总被引:2,自引:1,他引:2  
介绍了关联规则的数据挖掘,对布尔关联规则中的经典算法-Apriori算法进行了分析和评价,指出了基本Apriori算法的不足,并提出具有广泛适应性的改进算法,此算法既提高在扫描数据库过程中的信息区率,又及时剔除超集不是频繁项集的项集,进一步缩减项集的潜在规模,提高了频繁项集生成的效率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号