首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 109 毫秒
1.
本文采用一种基于布尔矩阵的频繁集挖掘算法。该算法直接通过支持矩阵行向量的按位与运算来找出频繁集,而不需要Apriori算法的连接和剪枝,通过不断压缩支持矩阵,不仅节约了存储空间,还提高了算法的效率。  相似文献   

2.
关联规则挖掘Apriori算法的研究与改进   总被引:7,自引:1,他引:6  
关联规则挖掘是数据挖掘研究领域中的一个重要任务,旨在挖掘事务数据库中有趣的关联.Apriori算法是关联规则挖掘中的经典算法.然而Apriori算法存在着产生候选项目集效率低和频繁扫描数据等缺点.对Apriori算法的原理及效率进行分析,指出了一些不足,并且提出了改进的Apriori_LB算法.该算法基于新的数据结构,改进了产生候选项集的连接方法.在详细阐述了Apriori_LB算法后,对Apriori算法和Apriori_LB算法进行了分析和比较,实验结果表明改进的Apriori_LB算法优于Apriori算法,特别是对最小支持度较小或者项数较少的事务数据库进行挖掘时,效果更加显著.  相似文献   

3.
该文在对关联规则挖掘中Apriori算法的深入研究和分析的基础上,发现并指出了该算法存在的不足,并对其进行以下三方面改进:改善候选项集支持度的计算方法;缩小候选项集的生成规模;减少对数据库的扫描次数。实验结果表明,改进算法性能得到了明显提高。  相似文献   

4.
关联规则挖掘Apriori算法的改进   总被引:3,自引:0,他引:3  
在分析研究关联规则挖掘Apriori算法及其若干改进算法的基础上,对Apriori算法做了进一步地改进,提出一种基于条件判断的新思想.改进后的算法根据条件采用了事务压缩与候选项压缩的相结合的方式,减小了不必要的开销,从而提高了挖掘速度.  相似文献   

5.
王琼  曹奎 《福建电脑》2012,28(12):84-86
关联规则的提取是数据挖掘中重要的研究课题,目的在于挖掘事务数据库中有趣的关联,Apriori算法是挖掘关联规则的经典算法。该文对Apriori算法进行研究,发现该算法存在着一些缺点,并对其进行改进,用实例说明这些改进能够正确有效的实现该算法。  相似文献   

6.
基于改进Apriori算法的关联规则挖掘研究   总被引:2,自引:0,他引:2  
朱其祥  徐勇  张林 《微机发展》2006,16(7):102-104
关联规则挖掘研究是数据挖掘研究的一项重要的内容。经典的关联规则提取算法———Apriori算法及其改进算法存在着一些不足,一是会产生大量的候选项目集,二是在扫描数据库时需要很大的I/O负载。通过对关联规则产生过程的实际实验分析发现,可以采取利用频繁k-1项集Lk-1对候选k项集Ck进行预先剪枝、及在扫描数据库过程中忽略对频繁项集的产生无贡献的交易记录的方法来改进关联规则提取的效率。  相似文献   

7.
关联规则挖掘中Apriori算法的研究与改进   总被引:5,自引:0,他引:5  
崔贯勋  李梁  王柯柯  苟光磊  邹航 《计算机应用》2010,30(11):2952-2955
经典的产生频繁项目集的Apriori算法存在多次扫描数据库可能产生大量候选及反复对候选项集和事务进行模式匹配的缺陷,导致了算法的效率较低。为此,对Apriori算法进行以下3方面的改进:改进由k阶频繁项集生成k+1阶候选频繁项集时的连接和剪枝策略;改进对事务的处理方式,减少Apriori算法中的模式匹配所需的时间开销;改进首次对数据库的处理方法,使得整个算法只扫描一次数据库,并由此提出了改进算法。实验结果表明,改进算法在性能上得到了明显提高。  相似文献   

8.
对挖掘关联规则中的Apriori算法的一种改进   总被引:1,自引:1,他引:0  
对挖掘关联规则的Apriori算法关键思想以及性能进行了研究,给出该算法的一个改进算法,该改进算法提高了原算法的性能,并从实验中得出相关结果.  相似文献   

9.
关联规则反映了大量数据中项集间的相互依存性和关联性。Apriori算法是关联规则挖掘中的经典算法,目前已有很多的改进版本,但大多存在多次扫描数据库,项集生成瓶颈和模式匹配频繁的问题,算法效率比较低。本文深入的分析研究关联规则Apriori算法,改进候选频繁项目集的连接和剪枝策略,改进对事务的处理方式,减少模式匹配所需的时间开销,并给出了改进算法。  相似文献   

10.
设计并实现了一个基于Apriori算法的关联规则挖掘系统.该系统采用Java技术,具有可移植性强、人机交互界面美观、实用性强等优势,可以对频繁项集和关联规则进行挖掘.并对系统进行了测试,发现当数据规模相同时,最小支持度越大,Apriori算法挖掘时间越短;当最小支持度相同时,数据规模越大,Apriori算法挖掘的时间越长.  相似文献   

11.
在数字档案馆建设中.如何从海量原始档案快速提取信息,满足用户的需求,给用户提供个性化的服务是至关重要.数据挖掘技术将会起到巨大作用。介绍数字档案馆的相关概念,以及数据挖掘技术在数字档案馆中应用.并初步研究关联规则以及Apriori算法在数字档案馆用户管理方面的应用。  相似文献   

12.
随着人们利用信息技术生产和搜集数据的能力的提高,数据资料的规模急速膨胀,从庞大的数据中提取有用的知识和信息是数据挖掘的主要任务,而关联规则的挖掘足数据挖掘领域中的一个重要分支.Fp-gmwth算法是目前最有效的关联规则频繁模式挖掘算法之一,然而,由于在挖掘的过程中需要递归的生成频繁模式树,直接把Fp-growth算法应用在文本中的算法效率并不高.针对文本数据的稀疏性,提出了一个基于频繁模式树即Fp-tree和支持度矩阵相结合的最大频繁项目集挖掘算法,缩小了搜索空间,提高了算法的效率.算法分析和实验表明,算法对稀疏型数据集和稠密型数据均适用.  相似文献   

13.
在数字档案馆建设中,如何从海量原始档案快速提取信息,满足用户的需求,给用户提供个性化的服务是至关重要,数据挖掘技术将会起到巨大作用。介绍数字档案馆的相关概念,以及数据挖掘技术在数字档案馆中应用,并初步研究关联规则以及Apriori算法在数字档案馆用户管理方面的应用。  相似文献   

14.
挖掘关联规则中的一种优化的Apriori算法   总被引:20,自引:0,他引:20  
对文献[1]中给出的算法以及Apriori算法的思想和性能进行了分析,提出一种优化的Apriori算法。该算法较文献[1]的算法更优.  相似文献   

15.
基于Apriori的有效关联规则挖掘算法的研究   总被引:29,自引:0,他引:29  
通过对Apriori算法进行的分析与研究,发现其在实用中存在两个主要问题:生成的关联规则具有相当大的冗余性;有可能挖掘出一条支持度和置信度均很高,但却是无趣的、甚至是虚假的关联规则,且不能产生带有否定项的规则。鉴于此,该文给出了关联规则的两个性质和引入兴趣度的第三个度量———相关支持度,设计了挖掘出有效关联规则算法,较好地解决了上述问题。  相似文献   

16.
基于矩阵的关联规则挖掘算法   总被引:9,自引:0,他引:9  
文章通过对Apriori算法的思想和性能的分析,提出一种基于矩阵的关联规则挖掘算法。新算法直接通过对布尔矩阵的列向量进行对位“与”运算产生频繁项集,有效地解决了Apriori算法迭代产生频繁项集的瓶颈问题。试验结果表明,新算法比Apriori算法具有更高的效率和性能。  相似文献   

17.
基于数组的关联规则挖掘算法   总被引:4,自引:1,他引:3  
文章提出了基于数组的关联规则挖掘算法,只需要扫描数据库1次,利用数组的结构特性来提高挖掘效率。  相似文献   

18.
关联规则是数据挖掘的重要内容之一。为了高效、快速地从事务数据库中挖掘出频繁项目集,针对数据挖掘的经典关联规则Apriori算法的瓶颈问题提出了改进的方法。通过对基于数组的Apriori算法的改进,只扫描一次数据库,在生成候选频繁项目集前进行判断,减少非频繁的候选的项目集的生成,并通过减少数组数据的扫描和不断压缩数组,提高了算法的运行效率,节约了开销。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号