首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 170 毫秒
1.
基于数据仓库的高效关联规则的挖掘   总被引:2,自引:0,他引:2  
提出在基于数据仓库的关联规则发现中生成最小关联规则集来代替完全关联规则集,最小关联规则集必须具备两个条件:(1)最小关联规则集是最小、最简单的关联规则集合;(2)最小关联规则集与完全关联规则集有相同的置信度。通过最小关联规则集,可以有效地剪除弱关联规则,大幅度减少候选频繁项目集,从而提高规则发现效率。是后,在传统经典算法Apriori基础上设计了一个相应的高效算法。  相似文献   

2.
一个最优分类关联规则算法   总被引:1,自引:0,他引:1  
分类和关联规则发现是数据挖掘中的两个重要领域。使用关联规则算法挖掘分类规则被叫做分类关联规则算法,是一个有较好前景的方法。本文提出了一个最优分类关联规则算法——OCARA。该算法使用最优关联规则挖掘算法挖掘分类规则,并对最优规则集排序,从而获得一个分类精度较高的分类器。将OCARA与传统分类算法C4.5和一般分类关联规则算法CBA、RMR在8个UCI数据集上进行实验比较,结果显示OCARA具有更好的性能,证明OCARA是一个有效的分类关联规则挖掘算法。  相似文献   

3.
对于大量的高维度的交易数据,利用关联规则进行数据挖掘,用户难以进行解释和利用。主要两个原因:常规关联规则挖掘算法可产生大量关联规则;一些关联规则可部分重叠。若用户能自主选择,在关联规则挖掘中所使用的相关项集,则可解决该问题。提出一种新的视觉探索工具,结构化关联映射图,使用户能够以视觉方式找到相关项集的组。该方法使用健康检查结果数据集进行验证,并且实验结果表明具有最高2×2规则贡献的和值的结构化关联映射图有助于显著减少关联分析的复杂性,并且能够集中于搜索空间的特定区域关联规则挖掘,同时避免不相关的关联规则。  相似文献   

4.
一种基于多维集的关联模式挖掘算法   总被引:2,自引:0,他引:2  
大多数维间关联规则挖掘算法如基于数据立方体的关联规则挖掘算法都假定对象的属性取值只具有单值性.将对象的属性取值扩展到多值,据此提出多维集的概念和基于多维集关联规则的语义特征.在此语义特征下,提出了一个多维集的关联规则挖掘算法.该算法利用多维集关联规则的限制特征,能够在数据集缩减的同时进行侯选集的三重剪枝,因此,具有比直接使用apriori等算法更好的性能,分析了算法的性能和正确性、完备性,并通过实验对算法有效性进行了对比.  相似文献   

5.
高丽平  夏敏捷 《微机发展》2004,14(3):104-106
挖掘关联规则的任务是在给定交易集中,每个交易包含一个数据项集,关联发现函数作用在交易集上,返回各数据项集间存在的关系。现实世界中,普遍存在"多级"的概念,在许多应用中,数据项集之间有用的关联规则常常出现在相对较高的概念层中,但在较低概念层往往可以发现较特殊和专门的信息。文中给出了一个在多级概念层上交互挖掘关联规则的算法,并进行了讨论,实验结果表明此算法提高了数据挖掘的效率和速度,并减少了对系统资源的利用。  相似文献   

6.
挖掘关联规则的任务是在给定交易集中,每个交易包含一个数据项集,关联发现函数作用在交易集上,返回各数据项集间存在的关系.现实世界中,普遍存在"多级"的概念,在许多应用中,数据项集之间有用的关联规则常常出现在相对较高的概念层中,但在较低概念层往往可以发现较特殊和专门的信息.文中给出了一个在多级概念层上交互挖掘关联规则的算法,并进行了讨论,实验结果表明此算法提高了数据挖掘的效率和速度,并减少了对系统资源的利用.  相似文献   

7.
张春生  庄丽艳 《计算机应用》2013,33(10):2796-2800
Apriori关联规则数据挖掘算法只针对一类相关数据集进行数据挖掘,而现实世界中各种不同的数据集非常庞大,如何在不相关数据集间进行数据挖掘,拓展规则的数量具有挑战性。目前Apriori关联规则算法研究基本上集中在算法性能优化和针对不同数据形式的基础上,没有突破不相关数据集的界限。针对这个问题,首先给出了相关数据集、不相关数据集、相容数据集的概念,进一步给出了一种基于Apriori的不相关数据集中相容数据集间的关联规则演绎算法,给出了算法演绎规则,通过构建法证明了算法的正确性。通过实例演示了应用方法,该算法可实现基于Apriori的相容数据集间关联规则的规则演绎,是普通数据挖掘算法无法实现的,扩展了关联规则算法的应用领域;同时,由于关联规则是在相容数据集上独立挖掘出来的,没有进行原始数据间的交换,在一定程度上实现了隐私保护  相似文献   

8.
如何对生产环境中经代码混淆的结构化数据集的敏感属性(字段)进行自动化识别、分类分级,已成为对结构化数据隐私保护的瓶颈。提出一种面向结构化数据集的敏感属性自动化识别与分级算法,利用信息熵定义了属性敏感度,通过对敏感度聚类和属性间关联规则挖掘,将任意结构化数据集的敏感属性进行识别和敏感度量化;通过对敏感属性簇中属性间的互信息相关性和关联规则分析,对敏感属性进行分组并量化其平均敏感度,实现敏感属性的分类分级。实验表明,该算法可识别、分类、分级任意结构化数据集的敏感属性,效率和精确率更高;对比分析表明,该算法可同时实现敏感属性的识别与分级,无须预知属性特征、敏感特征字典,兼顾了属性间的相关性和关联关系。  相似文献   

9.
关联规则是数据挖掘中发现知识的一种有效方法,其中Apriori算法又是关联规则挖掘的经典算法。本文在分析该Apriori算法的基础上.介绍了该算法的c#实现,包括频繁集的发现和关联规则的生成,并且通过对传统购物篮数据中的频繁集进行了验证,并且得到了其中满足最小支持度和可信度的强关联规则。  相似文献   

10.
蔡伟贤  滕少华 《计算机工程与设计》2011,32(11):3594-3598,3715
为了从检测数据中发现潜在的、有效的入侵检测规则,提高入侵检测系统的检测率,提出一个基于分类关联规则的入侵检测系统模型。系统对数据集进行预处理,再利用改进的分类关联规则挖掘算法I-Apriori-TFP(total-from-partial)来产生所有的分类关联规则,并基于已产生的分类关联规则建立一个分类器,分类器经测试数据测试后,生成检测代理,最后利用检测代理对网络数据进行检测。实验结果表明,该方法能够有效地检测出网络数据中的入侵行为。  相似文献   

11.
基于免疫算法的多维关联规则挖掘方法   总被引:1,自引:0,他引:1  
关联规则挖掘是一个重要的数据挖掘问题,文章给出了一种基于免疫算法的多维关联规则挖掘算法,算法充分利用了免疫记忆特性,把挖掘的关联规则存入记忆库,加快了关联规则的挖掘速度。实验结果表明该算法具有较好的鲁棒性,能快速、有效地进行全局优化搜索。特别适用于大规模、海量数据库的挖掘。  相似文献   

12.
基于人工免疫系统的关联规则挖掘算法   总被引:4,自引:0,他引:4  
给出了一个基于人工免疫系统的关联规则挖掘算法。将训练数据作为抗原,候选模式作为人工识别球(ARB),通过免疫学习生成频繁模式并以免疫记忆的形式加以保存,最终生成关联规则。所给的应用实例说明本算法是可行、有效的。  相似文献   

13.
关联挖掘中的时效度研究   总被引:1,自引:0,他引:1  
传统的关联挖掘算法,以支持度和置信度作为评价标准来衡量规则是否有价值。然而,这种模式不能体现出数据的时效敏感特性,如Web数据和长期积累数据。文中将首次建立一个全新的时基模型来重新估计数据规则的价值,并给出时效度(time validity)作为新的规则价值衡量标准。最后,给出了基于这个新的时基模型的一种新并行算法。这种算法使得我们在挖掘过程中使用增量挖掘,而且使得用户可以通过互操作来优化挖掘过程。  相似文献   

14.
对关联规则算法进行了研究和分析,基于候选集的Apriori-like算法需要反复扫描数据库,并产生大量的候选集,在挖掘低支持度、长模式的规则时效率低下。针对算法的缺陷,该文提出了一种PS算法,优化了关联规则的挖掘。实验结果证明了该算法的有效性。  相似文献   

15.
一种有效的关联规则增量式更新算法   总被引:8,自引:2,他引:6  
关联规则是数据挖掘中的一个重要研究内容。目前已经提出了许多用于高效地发现大规模数据库中的关联规则的算法,而对已发现规则的更新及维护问题的研究却较少。文章提出了基于频繁模式树的关联规则增量式更新算法,以处理事务数据库中增加了新的事务数据集后相应关联规则的更新问题,并对其性能进行了分析。  相似文献   

16.
一种新的基于FP-Tree的关联规则增量式更新算法   总被引:2,自引:0,他引:2  
挖掘关联规则是数据挖掘研究的一个重要方面,目前已经提出了许多算法用于高效地发现大规模数据库中的关联规则,而维护已发现的关联规则同样是重要的.针对在事务数据库增加和最小支持度同时发生变化的情况下,如何进行关联规则的更新问题进行了研究,提出了一种新的基于频繁模式树的关联规则增量式更新算法,并对该算法进行了分析和讨论.  相似文献   

17.
关系数据库中关联规则挖掘的一种高效算法   总被引:10,自引:0,他引:10  
王芳  王万森 《微机发展》2004,14(9):20-22
近年来,关系数据库被越来越多的行业采用,大量的生产、管理、科研等信息被收集存储,因此在关系数据库中进行有效的关联规则挖掘的需求日益增强。文中根据事务数据库中布尔型关联规则挖掘的相关理论和方法,在分析了关系数据库中关联规则挖掘具有的特殊性的基础上,从利用结构化查询语言(SQL)对关系数据库简便而高效的操作出发,提出了一种在关系数据库中挖掘多值型、多维型关联规则的简易算法。实验证明该算法具有较高的执行效率和一定的实用性。  相似文献   

18.
时态关联规则挖掘是针对在一段时间范围内的关联挖掘,在现实中有较多的应用。现有的大多数时态关联挖掘算法或者需要多次扫描数据库,或者没有考虑各个项在数据集上出现或结束时间上的不同,因而挖掘性能受到较大的制约。为此,本文提出一种增量式的面向具有不同时间出现与结束的项的时态关联规则挖掘算法。为减少存储方面的开销,只需保存已挖掘过的历史数据集中的频繁1项集。为了减少数据的扫描量,通过有效的剪枝策略,有选择性地扫描相关事务项,至多只需扫描一次完整的数据库。实验证明,该算法具有较好的挖掘性能。  相似文献   

19.
提出以纹理联合关联规则来表达图像纹理特征以及挖掘纹理联合关联规则的算法。在纹理关联规则定义基础上,通过图像降噪预处理和数据挖掘预处理,采用模板统计挖掘方法挖掘低维和高维图像纹理联合关联规则。实验表明联合关联规则能够较好表达图像纹理特征,可以据此进行纹理分割。  相似文献   

20.
针对分布式数据挖掘需要节点间进行大量数据交换的缺点,根据张春生,宋琳琳提出的关联规则局部性原理,不进行数据交换,通过节点挖掘,直接得到局部性全局关联规则,通过各节点间规则的合并,直接得到非局部全局关联规则,该算法简单易行,不需要节点间的数据交换,提高了数据挖掘效率,不仅挖掘出其他分布式数据挖掘算法挖掘出的全局关联规则,还能够发现其他算法不能发现的局部全局规则.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号