首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
一种基于事务压缩的关联规则优化算法   总被引:10,自引:0,他引:10  
通过对Apriori算法挖掘过程进行分析,提出了一种基于事务压缩的关联规则挖掘算法.该算法充分利用Apriori性质,通过减少候选集的组合和减少数据库的扫描来提高挖掘的速度和减少数据库的I/O操作时间的开销,有效提高了关联规则的挖掘效率.并在Apriori算法的基础上设计了Apriori改进算法.  相似文献   

2.
随着彩票发行业越来越风行,从海量数据中挖掘有用的彩票数字组合信息,已经成为广大彩民十分关注的问题。文章研究数据挖掘中的Apriori算法对彩票数字组合数据进行挖掘,使用150期彩票开奖结果作为挖掘对象,利用该算法从中找出相对频繁出现的数字组合,并用VC 进行了程序实现。  相似文献   

3.
利用电商平台推荐算法难以准确建立用户关系网络,为保证平台内商品推荐的准确性,研究关联规则挖掘Apriori算法在农产品电商平台推荐中的应用方法。首先,计算具备相似性的用户关系强度,得到词语概率的分布规律,通过时间综合相似度获得多个主题内容的演化结果;其次,基于关联规则挖掘Apriori算法建立电商平台推荐模型,得到新的商品推荐算法;最后,以平均绝对误差与均方根误差作为推荐算法精度的指标,进行实验对比分析。实验结果表明,在不同的特征维数下,关联规则挖掘Apriori算法的平均绝对误差与均方根误差均为相同条件下的最小值,可见该方法在农产品电商平台推荐中最准确,其推荐精度最高。  相似文献   

4.
一种基于单事务项集组合的频繁项集挖掘算法   总被引:2,自引:0,他引:2  
曾波 《计算机科学》2008,35(1):196-197
Apriori是挖掘频繁项集的基本算法,目前该算法及其优化变种都没有解决候选项及重复扫描事务数据库的问题.文章通过对Apriori及其优化算法的深入探究,提出了一种基于单事务组合项集的挖掘算法,该算法在一个事务内部对"数据项"进行组合,在事务数据库中对所有相同"项集"进行计数.不经过迭代过程,不产生候选项集,所有频繁项集的挖掘过程只需对事务数据库一次扫描,提高了频繁项集挖掘效率.  相似文献   

5.
用VB对基于Apriori算法的数据挖掘的实现   总被引:4,自引:0,他引:4  
于卫红 《计算机工程》2004,30(2):196-196,F003
Apriori算法是一种最有影响的挖掘关联规则频繁项集的算法。文章以100期彩票的开奖结果作为挖掘对象,利用该算法从中找出相对频繁出现的数字组合,并用VB进行了程序实现。  相似文献   

6.
数据挖掘是一项热门技术,该技术融合了数据库、统计学等领域知识,关联规则的挖掘则能找出商品销售中商品之间的联系。本文针对Apriori算法,及其改进算法FP-Growth进行了研究,对比了Apriori算法与FPGrowth算法的效率,得出FP-Growth算法由于只需要对数据进行一次扫描即可生成相应的数据集,使其生成数据集的整体效率要高于Apriori算法。  相似文献   

7.
Apriori算法必须反复地扫描数据库才能求出频繁项集,效率较低,且不支持更新挖掘。为了解决这些问题,提出了一种基于粗糙集、单事务项组合和集合运算的关联规则挖掘算法。本算法首先利用粗糙集进行属性约简,对新决策表中的每个事务进行“数据项”组合并标记地址,然后利用集合运算的方法计算支持度和置信度即可挖掘出有效规则。本算法只需要一次扫描数据库,同时有效地支持了关联规则的更新挖掘。应用实例和实验结果表明,本算法明显优于Apriori算法,是一种有效且快速的关联规则挖掘算法。  相似文献   

8.
Apriori算法低频规则的有效性及实现   总被引:1,自引:0,他引:1  
针对经典Apriori算法基于全局、高频两个条件的缺陷,指出事务数据库低频规则的有效性,并通过对C4.5决策树的规则构造,进一步证明事务数据库存在低频规则,在此基础上,给出了一种Apriori低频规则挖掘算法。该算法与经典的Apriori算法兼容,但不是对Apriori算法简单的扩展,而是从理论上打破了Apriori算法基于全局和高频两个条件。最后通过实例用Apriori低频规则挖掘算法和C4.5算法对实例数据库进行挖掘,证明两者的一致性和Apriori低频规则的有效性,同时也证明了Apriori低频规则挖掘算法的有效性。  相似文献   

9.
基于XQUERY和XSLT的不规则XML文档的关联规则挖掘   总被引:1,自引:0,他引:1  
曹春静  王新伟 《计算机应用》2007,27(Z2):251-253
目前,XQUERY语言实现的Apriori算法只能挖掘结构规整的XML数据,而无法对复杂不规则的XML数据进行挖掘.针对这个问题,改进Apriori算法,引入SDST的概念,使用XSL和XSLT将结构不规整的XML文档转换为SDST,使SDST作为Apriori算法的应用接口,从而实现对复杂不规则XML数据的关联规则挖掘.  相似文献   

10.
该文根据用户的Web访问路径应用关联规则和类Apriori算法挖掘出该用户的频繁访问路径,通过对Apriori算法和目前针对提高该算法效率的各种优化技术的详细分析和研究,对类Apriori算法进行了改进,提出了基于筛选压缩的类Apriori挖掘算法,并进行了模拟实验,比较结果显示基于筛选压缩的类Apriori挖掘算法挖掘用户频繁遍历路径的效率高于类Apriori算法,最终可获取用户的频繁遍历路径。  相似文献   

11.
数据挖掘中的关联规则挖掘能够发现大量数据中项集之间有趣的关联或相关联系,特别是随着大量数据不停地收集和存储,从数据库中挖掘关联规则就越来越有其必要性。通过对关联规则挖掘技术及其相关算法Apriori进行分析,发现该技术存在的问题。Apriori算法是关联规则挖掘中的经典算法。对Apriori算法做了改进。借助0—1矩阵给出了计算项集的支持度计数的更快方法,同时还简化了Apriori算法中的连接和剪枝操作,从而在时间和空间上提高了Apriori算法的效率。  相似文献   

12.
关联规则挖掘Apriori算法的研究与改进   总被引:7,自引:1,他引:6  
关联规则挖掘是数据挖掘研究领域中的一个重要任务,旨在挖掘事务数据库中有趣的关联.Apriori算法是关联规则挖掘中的经典算法.然而Apriori算法存在着产生候选项目集效率低和频繁扫描数据等缺点.对Apriori算法的原理及效率进行分析,指出了一些不足,并且提出了改进的Apriori_LB算法.该算法基于新的数据结构,改进了产生候选项集的连接方法.在详细阐述了Apriori_LB算法后,对Apriori算法和Apriori_LB算法进行了分析和比较,实验结果表明改进的Apriori_LB算法优于Apriori算法,特别是对最小支持度较小或者项数较少的事务数据库进行挖掘时,效果更加显著.  相似文献   

13.
基于矩阵的Apriori算法的优化   总被引:1,自引:0,他引:1  
在数据挖掘中关联规则挖掘是很重要的一个方面,而Apriori算法是进行关联规则挖掘的经典算法。本文首先分析了经典Apriori算法,然后利用矩阵的思想对其改进,并利用事务压缩的思想对矩阵进行压缩。改进后的算法明显提高了Apriori算法的效率。  相似文献   

14.
关联规则是挖掘并且发现大量数据集中有趣的关联或者相关联系。其中最经典的是Apriori算法,但是Apriori算法存在一定的缺陷。文章分析了Apriori算法并且对其进行改进,用一具体实例说明改进后的Apriori算法压缩了事务矩阵,缩小了搜索空间,提高Apriori算法运行效率,从而使整个日志挖掘处理过程更加快捷。  相似文献   

15.
一种关联规则挖掘方法在客户分析中的应用   总被引:1,自引:0,他引:1  
数据挖掘(DataMining)是数据库系统和数据库应用的一个繁荣的学科前沿.Apriori算法作为数据挖掘中关联规则挖掘的算法之一,是一种最有影响的挖掘布尔关联规则频繁项集的算法.本文主要探讨Apriori算法的实现细节及其结合在电信业中的实现过程,并通过对实际数据的分析提出提高电信业务量的建议.  相似文献   

16.
挖掘频繁项目集是关联规则应用中的关键问题.目前挖掘频繁集主要有Apriori算法和频繁树法两大类.本文提出与上述两类算法完全不同的高效挖掘最大频繁集的算法:最小支持数最小组合算法(MSMCA).该算法不产生候选频繁集,能较大减少计算量的开销.此外,在此算法的研究中,本文提出另一个子课题:重复数列中最小支持数最小组合算法研究.  相似文献   

17.
Apriori算法是一种经典的关联规则发现算法。针对Web日志挖掘的特点,在Apriori算法基础上给出一种适用于动态事务数据库挖掘的关联规则发现算法,并对比该算法与Apriori算法的区别。将该算法应用到网站的日志挖掘中,实验证明该算法的性能较原算法有一定的提高。  相似文献   

18.
Apriori算法是关联规则挖掘中的经典算法。通过对Apriori算法的基本思想和性能的研究分析,提出了一种基于垂直事务列表的树形结构的挖掘算法,减少了候选频繁项集的数量,提高了挖掘算法的效率。实验结果表明新算法具有良好的性能。  相似文献   

19.
挖掘频繁项集是许多数据挖掘任务中的关键问题,也是关联规则挖掘算法的核心,提高频繁项集的生成效率一直是近几年数据挖掘领域研究的热点之一.在对关联规则挖 掘中基于Apriori算法的改进算法进行深入分析和研究后,本文根据Apriori算法的不足,提出了一种改进策略,从而得到一种优化的Apriori算法.最后,对频繁项集挖掘算法的发展方向进行了初步的探讨.  相似文献   

20.
针对传统平台运行Apriori算法来挖掘中医病案中用药组合规律时,存在着占用内存空间大、计算效率低和PB级数据无法处理等问题,提出基于Hadoop的中医哮喘用药组合关联分析方法。采用Mapreduce分布式计算框架和HBase分布式数据库优化Apriori算法性能:一方面使用Mapreduce计算框架并行处理数据,借助HBase高速读写数据的特性,加速频繁项集的产生;另一方面摒弃传统算法中的自连接产生候选项集方式,对每个节点上的数据,使用循环和递归相结合的方式产生候选集,提高候选集产生的效率。实验结果证明,借助基于Hadoop的中医哮喘用药组合关联分析方法挖掘中医药组合规律,效率更高,能更有效地指导临床实践。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号