首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 281 毫秒
1.
以前基于支持度一置信度框架的关联规则挖掘算法都是先用支持度做为阈值对搜索结果进行剪枝,产生频繁集,再针对频繁集产生关联规则,这就是频繁关联规则,然而在很多应用,诸如:鉴别相似的Web文件,网络中入侵检测等,有许多有趣的关联规则仅有很少的支持度,在本文中,针对这种情况,提出了一种可以挖掘非频繁项之间有趣规则的算法,此算法先用相似度作为兴趣度度量以算法结果进行剪枝。  相似文献   

2.
一种多重最小支持度关联规则挖掘算法   总被引:5,自引:0,他引:5  
针对单一最小支持度挖掘关联规则不能反应不同数据项出现频度与性质的问题,提出了一个基于频繁模式树的多重支持度关联规则挖掘算法MSDMFIA(Multiple minimum Supports for Discover Maximum Fre-quent Item sets Algorithm),根据不同数据项的特点定义多重支持度,通过挖掘数据库中的最大频繁项目集,计算最大频繁候选项目集在数据库中的支持度来发现关联规则.该算法可以解决关联规则挖掘中经常出现的稀少数据项问题,并解决了传统的关联规则挖掘算法中的生成频繁候选集和多次扫描数据库的性能瓶颈.实验结果表明,本文提出的算法在功能和性能方面均优于已有算法.  相似文献   

3.
一个改进项目的加权关联规则挖掘算法   总被引:1,自引:0,他引:1  
提出了一个改进的项目加权关联规则挖掘算法.该算法利用一个加权频繁项目集必须满足的加权支持度下界,对加权频繁候选项目集进行剪枝,该下界计算简便,可以减少挖掘的计算量.理论分析和实验表明本算法和MINWAL(W)相比,具有生成候选集数量少、挖掘效率高等特点,特别在项目权值相差不大时,本算法的优势更明显.  相似文献   

4.
王璇 《丹东纺专学报》2011,(2):154-158,163
将关联图的数据挖掘思想应用到频繁闭模式的挖掘中,使用位向量的技术简化项集支持度的计算,构造关联图表示项集间的频繁关系。在此基础上,提出一种频繁闭模式挖掘算法,针对频繁闭模式的特点,结合剪枝策略、子集检测策略、搜索策略等技术手段,优化算法性能。实验结果表明,该算法在时间性能上优于经典的频繁闭模式算法CLOSET。  相似文献   

5.
基于关联图的频繁闭模式挖掘   总被引:1,自引:1,他引:0  
将关联图的数据挖掘思想应用到频繁闭模式的挖掘中,使用位向量的技术简化项集支持度的计算,构造关联图表示项集间的频繁关系.在此基础上,提出一种频繁闭模式挖掘算法,针对频繁闭模式的特点,结合剪枝策略、子集检测策略、搜索策略等技术手段,优化算法性能.实验结果表明,该算法在时间性能上优于经典的频繁闭模式算法CLOSET.  相似文献   

6.
基于集体度-置信度的关联规则挖掘   总被引:2,自引:0,他引:2  
总结并研究了基于集体度-置信度的关联规则挖掘算法,用集体度代替支持度对搜索空间进行压缩,成功地解决了传统的频繁关联规则挖掘存在的属性集产生上的欺骗性及处理稠密数据集方面的缺陷.  相似文献   

7.
Apriori算法是挖掘关联规则频繁项集的最有影响的算法之一,它通过连接、剪枝等步骤产生频繁项集,进而产生强关联规则。由于面临海量数据,因此将会产生大量的候选项集,尤其是候选2-项集,严重影响了挖掘的效率。提出了一种改进的算法,此算法不产生小项候选集而直接产生大项候选集,从而提高了算法的效率。  相似文献   

8.
针对已有的对低支持度关联规则进行挖掘的算法中没有提出对具有多个相关项的关联规则进行挖掘的有效方法,本文提出一种能够对低支持度关联规则的多个相关项进行有效挖掘的方法。算法基于相似度来衡量各个相关项的关联程度,在已有算法的基础上增加了一次特殊的矩阵转换,从而将对项的相似度衡量方法进行了转换,转换后的矩阵可以基于Apriori性质来拓展多个相似相关项。算法在低支持度情况下具有较高的挖掘效率和良好的挖掘效果,算法还可以用来挖掘多个项之间的排斥规则。  相似文献   

9.
发现最大频繁项目集是关联规则挖掘的重要步骤,针对关联规则挖掘中最小支持度发生变化的增量式更新问题,提出了高效发现最大频繁项目集的更新算法.该算法在FP树的基础上增加了记录各项目支持数的表,在头表中增加了域,从而减少了访问事务数据库和FP树的时间,提高了发现最大频繁项目集的效率.  相似文献   

10.
在数据挖掘技术中,关联规则可以挖掘发现大量的数据中项集之间有趣的关系或相关联系。冰山查询是关联规则挖掘的一种算法,特别是针对购物篮分析。介绍了数据挖掘的具体应用,使用改进的BUC算法(BUCE算法)以深度优先的处理方法,并综合其他传统算法,提高了处理冰山查询的有效性。同时BUCE算法在数据分组后聚集,减少I/O开销;对分组的数据排序,有利于数据的剪枝处理,将小于最小支持度的分组以后的数据可以全部剪去。所以BUCE算法提高了BUC算法的执行效率  相似文献   

11.
关联规则挖掘算法是通信网告警相关性分析中的重要方法。在处理数量庞大的告警数据库时,算法的效率显得至关重要,而经典的FP-growth算法会产生大量的条件模式树,使得在通信网环境下挖掘关联规则的难度非常大。针对上述问题,提出了一种基于分层频繁模式树的LFPTDP算法,采用分层模式树的方法产生频繁项集,从而避免了产生大量的条件模式树,并用动态剪枝的方法删除大量的非频繁项。算法分析及仿真表明,LFPTDP算法具有较好的时间和空间效率,是一种适合于通信网告警相关性分析的关联规则挖掘算法。  相似文献   

12.
Indirect association is a high level relationship between items and frequent item sets in data. There are many potential applications for indirect associations, such as database marketing, intelligent data analysis, web -log analysis, recommended system, etc. Existing indirect association mining algorithms are mostly based on the notion of post - processing of discovery of frequent item sets. In the mining process, all frequent item sets need to be generated first, and then they are fihered and joined to form indirect associations. We have presented an indirect association mining algorithm (NIA) based on anti -monotonicity of indirect associations whereas k candidate indirect associations can be generated directly from k - 1 candidate indirect associations, without all frequent item sets generated. We also use the frequent itempair support matrix to reduce the time and memory space needed by the algorithm. In this paper, a novel algorithm (NIA2) is introduced based on the generation of indirect association patterns between itempairs through one item mediator sets from frequent itempair support matrix. A notion of mediator set support threshold is also presented. NIA2 mines indirect association patterns directly from the dataset, without generating all frequent item sets. The frequent itempair support matrix and the notion of using tm as the support threshold for mediator sets can significantly reduce the cost of joint operations and the search process compared with existing algorithms. Results of experiments on a real - word web log dataset have proved NIA2 one order of magnitude faster than existing algorithms.  相似文献   

13.
关联规则挖掘是数据挖掘的重要领域之一,目前多数监督学习算法对满足最小支持度和最小置信度的关联规则进行深入分析的较少。剖析了分类关联规则挖掘算法CAR-Apriori算法,并提出了一种基于多最小支持度和支持度差别限制的分类关联规则挖掘算法MSCAR-Apriori算法。实验结果表明,改进算法不仅可以挖掘出满足给定条件的分类关联规则,同时还可以保留稀有但用户感兴趣且可能蕴涵巨大利润的规则项。  相似文献   

14.
针对现有数据分析系统实际响应时间过长的问题,在关联规则的支持下,设计一种大学生体质测试健康数据分析系统。搭建系统硬件结构,设计数据采集电路,控制硬件电路的功率输出,优化大学生体质测试健康数据采集过程;构建体质健康关联规则,采用二分模型控制函数阈值,结合JAVA技术,将大学生体质测试健康数据分析系统划分为登录模块、数据管理模块、数据分析模块以及数据回调模块等不同的模块,确定体质测试数据集,生成实际所需的健康数据分析规则,完成大学生体质测试健康数据分析。实验结果表明:完成一次数据分析后,可分辨的数据项数量与实际的健康数据项数值相等,且系统响应时间较最短。  相似文献   

15.
软集是一种新的处理不确定性问题的数学工具。基于软集和逻辑公式,提出一种新的关联规则挖掘方法。将软真度引入软集数据关联规则挖掘,利用软真度描述属性集之间的量化关系;讨论软真度和支持度之间的联系,给出满足给定的支持度阈值和可信度阈值的软关联规则挖掘方法。实例分析结果表明,该方法可约简冗余,提高效率。  相似文献   

16.
针对关联规则挖掘过程中定义最小支持度与置信度的阈值具有主观性的问题,提出一种迭代粒子群优化(particle swarm optimization,PSO)的方法挖掘关联规则。通过定义要提取的规则数目(M)的值,采用支持度和置信度定义适应函数,粒子群优化算法迭代,从数据集中提取最优的规则。算法避免了apriori算法需要设定最小支持度和最小置信度阈值等问题。通过对3个不同类型典型数据集挖掘验证算法的有效性,结果表明,使用PSO获得的规则平均支持度和置信度与apriori算法挖掘到的规则相比有明显提高。  相似文献   

17.
基于图的Apriori改进算法   总被引:3,自引:0,他引:3  
Apriori算法是关联规则挖掘中的经典算法,算法的核心思想是一种基于频繁理论的自底向上的递推方法。文中对Apriori算法进行分析,发现其中存在的问题。对Apriori算法做了改进。改进后的算法基于自顶向下的思想。利用有向图给出计算候选项集和项集支持度计数的更快的方法,同时简  相似文献   

18.
针对负关联规则挖掘所带来的问题,提出加入最大支持度来控制频繁项集生成规模,改进了相关性的计算公式,并将其用作正负关联规则的兴趣度来剔除无兴趣的关联规则,限制关联规则中的前后件项目个数来保证挖掘出的关联规则的实用性和可理解性。最后,给出一种能够同时挖掘正负关联规则的算法,实验结果表明算法是有效的、可行的。  相似文献   

19.
Apriori算法分析与改进综述   总被引:5,自引:0,他引:5  
数据挖掘中的关联规则挖掘能够发现大量数据中项集之间有趣的关联或相关联系,特别是随着大量数据不停地收集和存储,从数据库中挖掘关联规则就越来越有其必要性.通过对关联规则挖掘技术及其相关算法Apriori进行分析,发现该技术存在的问题.本文介绍了能优化该技术的各种算法,分析了这些算法各自的优缺点,并针对这些问题提出了未来的研究方向.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号