首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 203 毫秒
1.
针对负关联规则挖掘所带来的问题,提出加入最大支持度来控制频繁项集生成规模,改进了相关性的计算公式,并将其用作正负关联规则的兴趣度来剔除无兴趣的关联规则,限制关联规则中的前后件项目个数来保证挖掘出的关联规则的实用性和可理解性.最后,给出一种能够同时挖掘正负关联规则的算法,实验结果表明算法是有效的、可行的.  相似文献   

2.
基于兴趣度含正负项目的关联规则挖掘方法   总被引:1,自引:0,他引:1  
项目的引入使得挖掘出的频繁项集成倍增加,同时生成的关联规则数量更加庞大,引入兴趣度来约束从频繁项 集中提取关联规则的数量。分析现有的兴趣度模型,从中选择了一种适合于含正负项目的关联规则挖掘的兴趣度方法,并且 提出了置信度的一个性质,描述了含正负项目的频繁项集挖掘关联规则的算法,并对矛盾关联规则进行了分析。实验结果表 明,该算法是有效和可行的。  相似文献   

3.
一种多重最小支持度关联规则挖掘算法   总被引:5,自引:0,他引:5  
针对单一最小支持度挖掘关联规则不能反应不同数据项出现频度与性质的问题,提出了一个基于频繁模式树的多重支持度关联规则挖掘算法MSDMFIA(Multiple minimum Supports for Discover Maximum Fre-quent Item sets Algorithm),根据不同数据项的特点定义多重支持度,通过挖掘数据库中的最大频繁项目集,计算最大频繁候选项目集在数据库中的支持度来发现关联规则.该算法可以解决关联规则挖掘中经常出现的稀少数据项问题,并解决了传统的关联规则挖掘算法中的生成频繁候选集和多次扫描数据库的性能瓶颈.实验结果表明,本文提出的算法在功能和性能方面均优于已有算法.  相似文献   

4.
针对已有的对低支持度关联规则进行挖掘的算法中没有提出对具有多个相关项的关联规则进行挖掘的有效方法,本文提出一种能够对低支持度关联规则的多个相关项进行有效挖掘的方法。算法基于相似度来衡量各个相关项的关联程度,在已有算法的基础上增加了一次特殊的矩阵转换,从而将对项的相似度衡量方法进行了转换,转换后的矩阵可以基于Apriori性质来拓展多个相似相关项。算法在低支持度情况下具有较高的挖掘效率和良好的挖掘效果,算法还可以用来挖掘多个项之间的排斥规则。  相似文献   

5.
关联规则挖掘是数据挖掘的重要领域之一,目前多数监督学习算法对满足最小支持度和最小置信度的关联规则进行深入分析的较少。剖析了分类关联规则挖掘算法CAR-Apriori算法,并提出了一种基于多最小支持度和支持度差别限制的分类关联规则挖掘算法MSCAR-Apriori算法。实验结果表明,改进算法不仅可以挖掘出满足给定条件的分类关联规则,同时还可以保留稀有但用户感兴趣且可能蕴涵巨大利润的规则项。  相似文献   

6.
针对传统的关联规则数据挖掘的支持度-置信度框架存在很多缺陷,同时研究正负关联规则时可能产生很多问题的情况,阐述了在正负关联规则挖掘中,如何利用允许用户指定多重最小支持度来反应数据库中项的性质和它们各种各样的频率,并通过设置相关度提高挖掘效率.实验结果显示该方法是有效的.  相似文献   

7.
传统的基于支持度—置信度框架的关联规则挖掘方法可能会产生大量不相关的、甚至是误导的关联规则,同时也不能区分正负关联规则。在充分考虑用户感兴趣模式的基础上,采用一阶谓词逻辑作为用户感兴趣的背景知识表示技术,提出了一种基于背景知识的包含正负项目集的频繁模式树,给出了针对正负项目集的约束频繁模式树的构造算法NCFP-Construct,从而提高了关联规则挖掘的效率和针对性,实验结果显示该方法是有效的。  相似文献   

8.
关联规则挖掘算法中常用的支持度和可信度是对关联规则在统计意义上的有效性度量,在挖掘结果的有用度上缺乏指导作用,它们不能作为有用性的指标.从数据挖掘的最终目的出发定义了基于最终用户实际目标的效益度指标,并对最小效益度筛选性质进行了论证,提出了一种快速有效的关联规则挖掘算法.讨论了从关联规则的兴趣模板和限制模板转换到效益度的方法.实验结果表明,效益度指标具有支持度与可信度不可替代的作用;该算法的最小效益度剪切技术是有效的,不仅可以较大幅度地提高算法速度,而且可以作为规则模板的统一实现算法以及提供更精确的控制.  相似文献   

9.
以前基于支持度一置信度框架的关联规则挖掘算法都是先用支持度做为阈值对搜索结果进行剪枝 ,产生频繁集 ,再针对频繁集产生关联规则 ,这就是频繁关联规则。然而在很多应用中 ,诸如 :鉴别相似的Web文件、网络中入侵检测等 ,有许多有趣的关联规则仅有很少的支持度。在本文中 ,针对这种情况 ,提出了一种可以挖掘非频繁项之间有趣规则的算法 ,此算法先用相似度作为兴趣度度量对算法结果进行剪枝  相似文献   

10.
以前基于支持度一置信度框架的关联规则挖掘算法都是先用支持度做为阈值对搜索结果进行剪枝,产生频繁集,再针对频繁集产生关联规则,这就是频繁关联规则,然而在很多应用,诸如:鉴别相似的Web文件,网络中入侵检测等,有许多有趣的关联规则仅有很少的支持度,在本文中,针对这种情况,提出了一种可以挖掘非频繁项之间有趣规则的算法,此算法先用相似度作为兴趣度度量以算法结果进行剪枝。  相似文献   

11.
由频繁项集产生的关联规则往往不能保证规则前、后件中的项是正相关的,因此可能产生无意义的关联规则;当这些关联规则用于分类时,会产生大量无用分类规则,增加了时间开销.因此,基于数学期望提出了正相关的频繁项集的分类算法.该算法在挖掘正相关频繁项集时,利用置信度进行规则选取,生成正相关关联规则组成的分类器对数据集进行分类.实验表明,这种分类算法可以大幅度减少所产生的频繁项集数量,分类准确率达到C4.5和CMAR的水平,且显著减少了算法的时间.  相似文献   

12.
关联规则挖掘算法是通信网告警相关性分析中的重要方法。在处理数量庞大的告警数据库时,算法的效率显得至关重要,而经典的FP-growth算法会产生大量的条件模式树,加权算法MINWAL (O)则需要多次扫描数据库,使得在通信网环境下挖掘关联规则的难度非常大。该文提出了一种高效的基于加权频繁模式树的通信网告警关联规则挖掘算法,算法性能测试表明,该算法与已有的加权关联规则挖掘算法相比较,节约了大量的存储空间,提高了算法的挖掘速度,对通信网的故障诊断和故障定位有着积极的意义。  相似文献   

13.
关联规则挖掘是数据挖掘及知识发现领域的重要研究内容之一,其核心任务是挖掘数据库中的频繁项集.Apriori算法是频繁项集挖掘的有效算法.在Apriori的算法中,采用哈希树存储平凡项集的候补项集以便快速计算其支持度.本文在分析算法所存在的效率瓶颈的基础上,提出了一个有效的改进算法,通过利用一维数组替代算法中复杂的哈希树...  相似文献   

14.
关联规则挖掘算法是通信网告警相关性分析中的重要方法。在处理数量庞大的告警数据库时,算法的效率显得至关重要,而经典的FP-growth算法会产生大量的条件模式树,使得在通信网环境下挖掘关联规则的难度非常大。针对上述问题,提出了一种基于分层频繁模式树的LFPTDP算法,采用分层模式树的方法产生频繁项集,从而避免了产生大量的条件模式树,并用动态剪枝的方法删除大量的非频繁项。算法分析及仿真表明,LFPTDP算法具有较好的时间和空间效率,是一种适合于通信网告警相关性分析的关联规则挖掘算法。  相似文献   

15.
基于参数约简和免疫算法的飞行规则自动提取方法   总被引:1,自引:0,他引:1  
模拟机自动评分系统对飞行员数据进行评分的时候需要量化飞行规则,针对规则量化困难的问题,提出了一种基于参数约简和免疫算法的飞行规则自动提取方法。用该方法对某航空公司提供的正常爬升科目的大量飞行数据进行了规则提取,将提取到的规则对正反例样本之外多个飞行数据进行判读,结果表明均未出现误判。与没有采用参数约简的方法相比,用该方法提取到的规则更简洁、更准确,对专家制定用于自动评分系统中量化的飞行规则具有很好的参考价值。  相似文献   

16.
Apriori算法分析与改进综述   总被引:5,自引:0,他引:5  
数据挖掘中的关联规则挖掘能够发现大量数据中项集之间有趣的关联或相关联系,特别是随着大量数据不停地收集和存储,从数据库中挖掘关联规则就越来越有其必要性.通过对关联规则挖掘技术及其相关算法Apriori进行分析,发现该技术存在的问题.本文介绍了能优化该技术的各种算法,分析了这些算法各自的优缺点,并针对这些问题提出了未来的研究方向.  相似文献   

17.
提高频繁项集挖掘算法的效率一直是数据挖掘领域中关联规则挖掘研究的一个重点.针对数据挖掘的现状及关联规则算法的瓶颈问题,提出一种基于串与运算的关联规则挖掘算法,对该算法进行了阐述.最后对该算法的特点进行了总结并对关联规则挖掘的未来研究方向进行了展望.  相似文献   

18.
发现最大频繁项目集是关联规则挖掘的重要步骤,针对关联规则挖掘中最小支持度发生变化的增量式更新问题,提出了高效发现最大频繁项目集的更新算法.该算法在FP树的基础上增加了记录各项目支持数的表,在头表中增加了域,从而减少了访问事务数据库和FP树的时间,提高了发现最大频繁项目集的效率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号