首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
设计并实现了一个基于Apriori算法的关联规则挖掘系统.该系统采用Java技术,具有可移植性强、人机交互界面美观、实用性强等优势,可以对频繁项集和关联规则进行挖掘.并对系统进行了测试,发现当数据规模相同时,最小支持度越大,Apriori算法挖掘时间越短;当最小支持度相同时,数据规模越大,Apriori算法挖掘的时间越长.  相似文献   

2.
基于XQUERY和XSLT的不规则XML文档的关联规则挖掘   总被引:1,自引:0,他引:1  
曹春静  王新伟 《计算机应用》2007,27(Z2):251-253
目前,XQUERY语言实现的Apriori算法只能挖掘结构规整的XML数据,而无法对复杂不规则的XML数据进行挖掘.针对这个问题,改进Apriori算法,引入SDST的概念,使用XSL和XSLT将结构不规整的XML文档转换为SDST,使SDST作为Apriori算法的应用接口,从而实现对复杂不规则XML数据的关联规则挖掘.  相似文献   

3.
一种基于事务压缩的关联规则优化算法   总被引:10,自引:0,他引:10  
通过对Apriori算法挖掘过程进行分析,提出了一种基于事务压缩的关联规则挖掘算法.该算法充分利用Apriori性质,通过减少候选集的组合和减少数据库的扫描来提高挖掘的速度和减少数据库的I/O操作时间的开销,有效提高了关联规则的挖掘效率.并在Apriori算法的基础上设计了Apriori改进算法.  相似文献   

4.
关联规则挖掘Apriori算法的研究与改进   总被引:7,自引:1,他引:6  
关联规则挖掘是数据挖掘研究领域中的一个重要任务,旨在挖掘事务数据库中有趣的关联.Apriori算法是关联规则挖掘中的经典算法.然而Apriori算法存在着产生候选项目集效率低和频繁扫描数据等缺点.对Apriori算法的原理及效率进行分析,指出了一些不足,并且提出了改进的Apriori_LB算法.该算法基于新的数据结构,改进了产生候选项集的连接方法.在详细阐述了Apriori_LB算法后,对Apriori算法和Apriori_LB算法进行了分析和比较,实验结果表明改进的Apriori_LB算法优于Apriori算法,特别是对最小支持度较小或者项数较少的事务数据库进行挖掘时,效果更加显著.  相似文献   

5.
基于关联规则的Apriori算法的可视化实现方法   总被引:5,自引:0,他引:5  
关联规则的提取是数据挖掘中的重要研究内容,对关联规则提取中的Apriori算法进行了分析与研究,针对该算法的运算效率不高,对该算法进行了优化.该算法以经典的Apriori算法为基础,改进后的算法在运算速度明显好于Apriori算法.同时,还介绍了一种基于Apriori算法的可视化挖掘模型[1],并讨论了该可视化模型的实现方法.  相似文献   

6.
一种关联规则挖掘方法在客户分析中的应用   总被引:1,自引:0,他引:1  
数据挖掘(DataMining)是数据库系统和数据库应用的一个繁荣的学科前沿.Apriori算法作为数据挖掘中关联规则挖掘的算法之一,是一种最有影响的挖掘布尔关联规则频繁项集的算法.本文主要探讨Apriori算法的实现细节及其结合在电信业中的实现过程,并通过对实际数据的分析提出提高电信业务量的建议.  相似文献   

7.
一种改进的Apriori算法   总被引:4,自引:2,他引:4  
数据挖掘中的关联规则挖掘能够发现大量数据中项集之间有趣的关联或相关联系,特别是随着大量数据不停地收集和存储,从数据库中挖掘关联规则就越来越有其必要性.通过对关联规则挖掘技术及其相关算法Apaod进行分析,发现该技术存在的问题.Apriori算法是关联规则挖掘中的经典算法.对Apriori算法做了改进.借助0-1矩阵给出了计算项集的支持度计数的更快方法,同时还简化了Apriori算法中的连接和剪枝操作,从而在时间和空间上提高了Apriori算法的效率.  相似文献   

8.
基于Apriori算法的改进算法   总被引:2,自引:0,他引:2  
关联规则挖掘是数据挖掘研究的一项重要内容.为了快速挖掘关联规则,分析了挖掘关联规则的Apriori算法,并在此基础上给出了一种改进的算法:NApriori算法,利用频繁1项集重新组织事务数据库来挖掘关联规则,此方法仅需扫描数据库2次,且避免了Apriori算法繁琐的连接和删除步骤,实验结果表明此方法比Apriori算法有更好的性能.  相似文献   

9.
挖掘最大频繁项目集是多种数据挖掘应用中的关键问题.在经典Apriori算法基础上给出了基于SQL的Apriori算法.对Web日志挖掘进行数据预处理的基础上,利用算法挖掘最大频繁访问页面集.实验结果表明算法的效率较好,并有助于促进网站的建设.  相似文献   

10.
挖掘频繁项集是许多数据挖掘任务中的关键问题,也是关联规则挖掘算法的核心,提高频繁项集的生成效率一直是近几年数据挖掘领域研究的热点之一.在对关联规则挖 掘中基于Apriori算法的改进算法进行深入分析和研究后,本文根据Apriori算法的不足,提出了一种改进策略,从而得到一种优化的Apriori算法.最后,对频繁项集挖掘算法的发展方向进行了初步的探讨.  相似文献   

11.
长项优先的产生算法——改进的Apriori算法   总被引:1,自引:0,他引:1  
Apriori算法是一种最有影响的挖掘布尔关联规则频繁项集的算法.本文简单介绍了Apriori算法,提出了Apriori算法的改进方案--长项优先的产生算法,它基于传统Apriori算法,通过改变候选项集的产生顺序来减少数据库访问,从而提高效率.  相似文献   

12.
根据MapReduce模型并行运行实现的特点,针对可扩展性差的传统Apriori的特点和传统Apriori算法,采用了"云"强大的廉价计算处理方式和关联规则挖掘算法,改进提高Apriori算法的运算效率。通过改进在云计算环境下MapReduce编程框架,并且结合验证MR-Apriori算法的实验为基础,这对传统意义上的Apriori算法在数据挖掘过程中所出现的客观问题进行处理,从而真正意义上的完成了本文研究的基于MapReduce并行的Apriori算法的扩展性提升的目标,并且表明了元计算技术结合关联规则挖掘算法的可能性。  相似文献   

13.
Apriori算法是一种挖掘关联规则的频繁项集算法,广泛应用于商业领域与网络安全领域.描述了使用R语言arules扩展包的Apriori算法对真实的商品交易数据进行关联规则挖掘的过程,并对挖掘结果进行分析.对商品交易数据的关联规则挖掘思路可借鉴应用于其他情景的关联规则挖掘.  相似文献   

14.
Apriori算法低频规则的有效性及实现   总被引:1,自引:0,他引:1  
针对经典Apriori算法基于全局、高频两个条件的缺陷,指出事务数据库低频规则的有效性,并通过对C4.5决策树的规则构造,进一步证明事务数据库存在低频规则,在此基础上,给出了一种Apriori低频规则挖掘算法。该算法与经典的Apriori算法兼容,但不是对Apriori算法简单的扩展,而是从理论上打破了Apriori算法基于全局和高频两个条件。最后通过实例用Apriori低频规则挖掘算法和C4.5算法对实例数据库进行挖掘,证明两者的一致性和Apriori低频规则的有效性,同时也证明了Apriori低频规则挖掘算法的有效性。  相似文献   

15.
挖掘关联规则是数据挖掘中一个重要的课题,产生频繁项集是其中的一个关键步骤.文章提出了一种基于矩阵压缩的Apriori优化算法,并将该算法与Apriori算法进行了比较.实验表明与Apriori算法相比,新算法的效率较好.  相似文献   

16.
挖掘关联规则中Apriori算法的研究   总被引:55,自引:0,他引:55  
文章是基于大型销售数据库研究了关联规则挖掘问题 .分析和探讨了 Apriori算法 ,并给出了该算法的实现思想 ,同时通过例子说明算法的执行过程  相似文献   

17.
关联规则的提取是数据挖掘中的重要研究内容,对关联规则提取中的Apriori算法进行了分析与研究,针对该算法的运算效率不高,对该算法进行了优化.Partition算法以经典的Apriori算法为基础,通过将数据库分成几个互不相交的块来实现算法效率的提高.同时,还介绍了一种基于Apriori-Partition算法的可视化挖掘模型,并讨论了该可视化模型的实现方法.  相似文献   

18.
该文根据用户的Web访问路径应用关联规则和类Apriori算法挖掘出该用户的频繁访问路径,通过对Apriori算法和目前针对提高该算法效率的各种优化技术的详细分析和研究,对类Apriori算法进行了改进,提出了基于筛选压缩的类Apriori挖掘算法,并进行了模拟实验,比较结果显示基于筛选压缩的类Apriori挖掘算法挖掘用户频繁遍历路径的效率高于类Apriori算法,最终可获取用户的频繁遍历路径。  相似文献   

19.
张正义  崔健 《计算机仿真》2021,38(6):104-108
以提升挖掘分析铁路物流配送频繁路径数据效率为目的 ,研究基于并行Apriori的铁路物流配送频繁路径挖掘算法,采用Fuzzy c-means算法聚类分析物流配送数据集,根据内部相似度将数据集分割出具有较高相似度的数据簇,利用改进Apriori算法挖掘分析各数据簇中包含的频繁模式获取各区域的物流频繁路径,通过分析合并物流频繁路径后生成各区域的频繁路径序列.借助Hadoop中的子项目Mahout和MapReduce实现Fuzzy c-means算法和改进Apriori算法的并行化.实验结果表明,上述算法有效提升频繁路径的挖掘效率以及精度,确保为物流管理者提供清晰的货物流向,在实际应用中具有更高适用性.  相似文献   

20.
数据挖掘技术及其在旅游线路规划系统的应用   总被引:5,自引:1,他引:4  
研究了旅游线路规划的现状,介绍了在旅游线路规划中使用的方法,引入了关联规则挖掘的基本概念,以及分析了其主要过程.并通过分析关联规则挖掘中的Apriori算法及其改进算法的基础上,提出了一种将Apriori改进算法与旅游线路规划挖掘结合的概念,通过与Apriori算法相比较,提高了系统的效率,并给出了一种典型应用,获得了较理想的应用效果.最后结合当前的旅游网站特点,充分应用网站的信息,设计了一个旅游线路规划的挖掘系统.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号