首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 140 毫秒
1.
关联规则是数据挖掘中的概念,通过分析数据找到数据之间的关联.海量数据会产生大量冗余和相似的关联规则,影响用户对规则的理解和判断.本文采用鸢尾花数据集进行实验.建立三个检验指标,删除冗余关联规则;在进行K-means分析时利用规则产生的三角形迭代选择初始点,再将删除冗余后的规则进行聚类.实验证实本文方法将相似的关联规则归为一簇,能有效的帮助用户迅速找到有用的关联规则,有助于用户更好的对规则进行理解和分析,提高了聚类的效率.  相似文献   

2.
电力调度数据挖掘后处理方法的研究   总被引:1,自引:0,他引:1  
关联规则是数据依赖关系的有效描述方法,是知识发现研究的重要内容.然而,随着所挖掘数据库规模的增大,由传统数据挖掘算法所生成的大量关联规则常常令用户的使用与分析十分困难.文中提出了一种新方法来解决这个问题并将其运用到电力调度数据挖掘系统中.实验结果表明,该方法消除了大量冗余规则,并且使用户可以从整体上把握整个规则集,提高了关联规则挖掘的准确性和易用性.  相似文献   

3.
孟军  王蓬  张静  王秀坤 《计算机科学》2013,40(1):183-186,217
传统关联规则挖掘可能会得到大量的、杂乱的规则,它们对用户来说是不相关的或不感兴趣的。提出最小关联规则集和项集强依赖关系的概念,以实现基于项集依赖的最小关联规则挖掘算法。其不仅可以避免验证某一频繁项集下的所有非空真子集是否可形成关联规则,还可以通过删除那些过于复杂、有重复信息的规则来进一步简化传统规则集合。通过最小关联规则集可推导得到大多数冗余规则的支持度和置信度,实现了传统规则集的一种近似无损表述。采用UCI机器学习库中数据集进行实验,结果表明提出的方法得到的规则数量明显减少,且规则更加简短、无重复信息,为最小关联规则挖掘提供了更好的方法。  相似文献   

4.
基于商品分类信息的关联规则聚类   总被引:11,自引:0,他引:11  
关联规则挖掘经常产生大量的规则,为了帮助用户做探索式分析,需要对规则进行有效的组织。聚类是一种有效的组织方法,已有的规则聚类方法在计算规则间距离时都需要扫描原始数据集,效率很低,而且聚类结果是固定数目的簇,不利于探索式分析.针对这些问题,提出了一种新的方法,它基于商品分类信息度量规则间的距离,避免了耗时的原始数据集扫描;然后用OPTICS聚类算法产生便于探索式分析的聚类结构。最后用某个零售业公司的实际交易数据做了实验,并通过可视化工具演示了聚类效果,实验结果表明此方法是实用有效的。  相似文献   

5.
一种用于网络安全系统的报警聚类与关联模型   总被引:3,自引:0,他引:3  
针对网络安全系统中普遍存在大量冗余报警的问题,本文提出一种新型报警处理模型。该模型通过相似性评估方法和分层机制对报警信息进行聚类,有效地减少了报警信息量;同时通过关联分析技术挖掘报警信息之间的潜在关联并生成新的规则,增强了识别未知攻击的能力,提高了聚类效率。  相似文献   

6.
秦东霞  姚遥 《电脑学习》2012,2(1):31-34
Web日志挖掘是Web数据挖掘的一个重要研究领域。Web日志挖掘通过发现Web日志中用户的访问规律和模式,可以提取出其中潜在的规律和信息,人们对这个领域的研究也日益重视。然而,传统的基于关联规则的Web日志挖掘算法都是基于所有关联规则的。这种方式往往挖掘产生大量的候选规则,而且存在大量冗余的规则。提出了一种新的无冗余的Web日志挖掘算法,该算法通过引入频繁闭项集合最小关联规则的概念,从而解决了以往基于所有关联规则挖掘算法中出现的上述问题。  相似文献   

7.
基于聚类和关联规则的挖掘算法   总被引:4,自引:0,他引:4       下载免费PDF全文
数据挖掘技术中关联规则可以很好地发现数据项之间存在的相互关系,同时有大量的挖掘算法可供选择。聚类分析就是通过分析数据库中的记录数据,根据一定的分类规则合理地划分记录集合,确定每个记录所在类别。它所采用的分类规则是由聚类分析工具决定的。本文研究 聚类和关联规则的挖掘算法。  相似文献   

8.
当前的支持向量机和均值聚类等数据挖掘算法中,几乎都是依靠数据之间的关联性来完成数据匹配。一旦数据库中含有大量的冗余数据,将造成数据之间的相关性降低,关联性被破坏,导致传统的数据挖掘算法效率降低。为了避免上述缺陷,提出了一种弱化关联规则修补挖掘算法。利用弱聚类方法,在数据选择过程中,不将所有的元素都进行初始分类处理,只计算某一元素属于某一个类别的概率,确定多个弱聚类中心,计算不同数据之间的弱聚类关联性,从而实现关联规则较弱的冗余环境下准确的数据挖掘。实验结果表明,这种算法能够有效提高海量冗余环境下的数据挖掘效率,取得了令人满意的效果。  相似文献   

9.
李琳  邵峰晶  杨厚俊  孙仁诚 《计算机科学》2011,38(8):176-178,211
针对传统多层关联分类挖掘产生大量冗余规则而影响分类效率的问题,提出了一种基于类FP-tree的多层关联分类器MACCF(Multi-level Associative Classifier based on Class FP-tree)。该分类器依据事务的类标号划分训练集,采用闭频繁模式(CLOSET+)产生完全候选项目集,通过设计适当的类内规则剪枝策略和类间规则剪枝策略,减少了大量冗余的分类规则,提高了分类的准确率;采用交又关联规则方法,解决了交叉层数据的分类问题,实验结果 表明了算法的高效性。  相似文献   

10.
由于现代网络数据量的急速增长,利用现有的算法生成关联规则时,冗余规则的数量远远大于实际有价值的规则,冗余规则不仅影响用户分析,而且使关联规则的利用率也大大降低。针对关联规则的冗余问题,提出了一种基于一阶谓词公式去除商务数据冗余关联规则的方法,利用一阶谓词公式来表示关联规则,通过等价公式进行转换,并利用算法和矩阵等价将谓词公式转换为邻接矩阵,然后利用冗余规则算法进行删除。实验原始数据为UCI数据集,并利用Weka生成关联规则。最后利用Matlab和Java实现冗余规则的去除。  相似文献   

11.
关联规则挖掘过程中,大量候选项集的产生成为影响挖掘效率提高的一个主要因素。针对这一问题,提出了一种基于树结构的关联规则挖掘算法。该算法运用关联矩阵将频繁项集映射到树结构中存储,并利用树中包含部分频繁项集的子树,逐步拓展成包含所有频繁项集的树结构;其不仅提高了候选项集的生成效率,而且极大地减少了候选项集的产生数量。实验证明,该算法相比同类算法是快速有效的。  相似文献   

12.
关联规则挖掘常常会产生大量的规则,这使得用户分析和利用这些规则变得十分困难。为了帮助用户做探索式分析,提出了一种基于距离的相关性关联规则优化方法,该方法从数学分析关联规则相关性概念公式的值的特点出发,通过根据关联规则结构上的相关性差别来挖掘出包括正负两种关联规则在内的更多潜在的相关规则,实验结果表明该方法有效且可靠。  相似文献   

13.
布尔时间序列中的关联规则挖掘较难处理,因为多数关联规则仅挖掘不同事务共同出现的规则,难以体现同一事件在不同时间内动态变化间的关联性.鉴于此,提出一种新的关联规则挖掘框架,利用常量化表示布尔数据的时间属性,结合聚类算法和关联分析,提高规则的支持度,从而解决布尔时间序列数据在关联规则挖掘中的时间值表示问题,并使用多种指标评价规则与传统算法比较.在真实的中风病预后好转数据预测中验证了所提出算法的有效性.  相似文献   

14.
加权关联规则的改进算法   总被引:7,自引:2,他引:7  
论文讨论了加权关联规则问题,针对布尔类型的加权关联规则问题提出一种改进算法。该算法首先利用普通的关联规则算法产生频繁集,然后在该频繁集的基础上产生加权频繁集。同时,给出了最优的最小支持度设定方法,保证了普通关联规则算法所产生的频繁集为加权频繁集的超集。该算法有较高的效率,并且能够有效利用已有的关联规则算法。  相似文献   

15.
基于Apriori算法的水平加权关联规则挖掘   总被引:19,自引:2,他引:19  
关联规则挖掘可以发现大量数据中项集之间有趣的关联或相关联系,并已在许多领域得到了广泛的应用。目前业界已经提出了许多发现关联规则的算法,这些算法都认为每个数据对规则的重要性相同。但在实际应用中,用户会比较倾向于自己最感兴趣或认为最重要的那部分项目,因此有必要加强这些项目对规则的影响,同时减弱另一些用户兴趣不大或认为不重要的项目对规则的影响。为此,论文提出了水平加权关联规则的问题,并结合Apriori算法,加以改进,给出了关于该问题的解决方案及有效算法New_Apriori。  相似文献   

16.
不可约关联规则及其应用   总被引:3,自引:0,他引:3  
在大型数据库项目之间发现关联规则是一个重要的数据挖掘问题,而挖掘出的关联规则数常常是巨大的,本文主要考虑不可约关联规则,不可约关联规则数通常比全部规则数少,讨论利用不可约关联规则可导出其它关联规则,并给出其算法。  相似文献   

17.
数据挖掘过程中只考虑数据项权重或者只考虑时态语义会导致挖掘结果不全面。针对该问题,对加权关联规则、时态关联规则和时态数据周期规律进行研究,将权值、K-支持期望和周期等概念引入到时态关联规则中,提出一种基于周期规律的加权时态关联规则挖掘算法。以某管理系统审计数据为例进行实验验证,结果表明该算法能够准确地挖掘出数据库中的加权时态关联规则,与加权关联规则算法相比,在时间复杂度相同的情况下能使关联规则的挖掘结果更加全面。  相似文献   

18.
讨论了在多值属性关系中进行关联规则挖掘的应用特点,提出利用数据整理和数值编码的方式对关联 规则挖掘算法进行优化。将目标数据属性按其在算法中的作用划分,并分别进行转换和编码;然后对数据先进 行聚类,再在聚类结果中发掘频繁项目集;最后利用聚类后关联规则快速更新算法获取关联规则。算法分析和 实验结果表明,该算法比传统的关联规则挖掘算法更有效率。  相似文献   

19.
Association rule mining is an important topic in data mining. The problem is to discover all (or almost all) associations among items in the transaction database that satisfy some user-specified constraints. Usually, the constraints are related to minimal support and minimal confidence. Class association rules (CARs) are a special type of association rules that can be applied for classification problem. Previous research showed that classification based on association rules has higher accuracy than can be achieved with an inductive learning algorithm or C4.5. As such, many methods have been proposed for mining CARs, although these use batch processing. However, datasets are often changed, with records added or/and deleted, and consequently updating CARs is a challenging problem. This paper proposes an efficient method for updating CARs when records are deleted. First, we use an MECR-tree to store nodes for the original dataset. The information in the nodes of this tree are updated based on the deleted records. Second, the concept of pre-large itemsets is used to avoid rescanning the original dataset. Finally, we propose an algorithm to efficiently update and generate CARs. We also analyze the time complexity to show the efficiency of our proposed algorithm. The experimental results show that the proposed method outperforms mining CARs from the dataset after record deletion.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号