首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
关联规则是一个应用广泛的数据挖掘算法,本文介绍了关联规则算法的工作原理,如何配置关联规则算法的参数及建立挖掘模型.结合一个高职院校的实例,对关联规则挖掘算法在专业课设置中的应用进行了研究,并对挖掘得到的结果进行了具体分析.  相似文献   

2.
基于关联规则的通信网络告警相关性分析模型   总被引:4,自引:0,他引:4  
在通信网络运行过程中.每天都会产生大量告警,将数据挖掘中的关联规则发现技术用于分析历史告警数据,可发现告警相关性规则。这些规则可辅助故障定位和告警过滤,以减轻网络管理员的工作强度,提高工作效率。本文分析了通信网络原始告警信息的特点,提出了一个基于关联规则的通信网络告警相关性分析模型,该模型通遏对原始告警数据进行预处理,不仅有效地解决了网络告警时间不同步问题,使得处理后的告警数据可直接用一般的关联规则挖掘工具发现告警相关规则,还大大地压缩了挖掘结果,提高了规则的准确率。初步的实验表明这种分析模型具有实用价值。  相似文献   

3.
针对网络故障复杂、告警数据库信息量大等问题,提出一种改进的增量式关联规则挖掘算法。采用关联规则挖掘技术,对告警数据库中的更新规则进行增量关联规则挖掘,将传统告警分析方法与挖掘出的关联规则相结合,应用于网络故障告警相关性分析中。实验结果表明,该算法能减少冗余规则,提高挖掘效率。  相似文献   

4.
徐璐 《福建电脑》2007,(10):88-89
数据挖掘是从海量数据库中挖掘有效或重要信息的过程.普通的关联规则挖掘是数据挖掘的一种基本的方法,但随着时间的推移,挖掘数据库的规模会发生不断变化,人们对数据的需求也会有所不同,如何从扩展数据库中高效地对已经推导出的关联规则进行更新,然后再利用更新的关联规则进行数据挖掘,这就是增量式挖掘关联规则的方法.  相似文献   

5.
线性关联规则研究   总被引:1,自引:0,他引:1  
首先讨论了布尔型关联规则的不足,然后提出了线性关联规则的概念,详细讨论了线性关联规则的挖掘方法,具体给出了线性关联规则的挖掘过程,分析了线性关联规则的作用。还给出了实验结果,并将线性关联规则和布尔型关联规则及定量关联规则进行了比较。  相似文献   

6.
商业活动和工程实践中通常会积累一些大规模的携带重要信息的数据,由于这种数据集经常有更新且数据量较大,在对它们进行增量式关联规则挖掘时,若采用基于传统的Apriori算法进行计算,一方面难以取得较好的效率;另一方面支持度设置过低会产生大量的冗余规则,设置过高则会把一些支持度不高但有用的规则过滤掉而导致算法对这些新规则感应迟钝。因此,借助遗传算法的相关机理,同时结合自然界的免疫进化理论及相关仿生机制,提出一种IOGA(Immune Optimization based Genetic Algorithm,基于免疫优化的遗传算法)增量式关联规则挖掘方法。通过实验表明,该方法应用于大规模数据集的增量式关联规则挖掘时,可以及时地感知规则的变更并发现有用的规则,减少了冗余规则的产生,同时挖掘效率也有明显提高。  相似文献   

7.
传统关联规则挖掘算法往往会产生过多规则而难以被决策者所采用。针对该问题,文章从应用的角度提出了最简有效关联规则,其特点是采用以后项为导向的挖掘方式,同时追求规则前后项之间的相关性,在此基础上给出了一种最简有效关联规则挖掘算法。利用该算法得到的最筒有效关联规则集包括的规则数量大为减少且能得出与全部有效关联规则集相同的决策,避免了大量的冗余挖掘及无效挖掘,提高了挖掘效率和应用效果。  相似文献   

8.
一种改进的正负关联规则挖掘算法   总被引:1,自引:0,他引:1  
陈宁军  高志年 《计算机科学》2011,38(12):191-193,212
针对传统正负关联规则挖掘算法需要多次扫描数据库并且生成大量候选频繁项集的问题,在对比目前相关研究成果的基础上,提出了一种改进的正负关联规则挖掘算法,它通过两次数据扫描完成对正负关联规则的挖掘,对最大频繁项集的挖掘算法做了改进,有效提高了算法效率,同时对置信度标准做了改进。基于某真实事务集的实验表明,算法提高了规则挖掘的质量和有效性。  相似文献   

9.
张素文  孟建良等 《微机发展》2003,13(4):64-66,70
从实际应用角度,在对模糊关联规则挖掘算法进行改进的基础上,提出了模糊关联规则的加权挖掘算法(FARMA),以及简化的关联规则的加权挖掘算法(SFARMA),通过实验验证了算法的可行性,并对算法的性能进行了讨论。  相似文献   

10.
一种具有最大推荐非空率的关联规则挖掘方法   总被引:4,自引:0,他引:4  
王大玲  于戈  鲍玉斌 《软件学报》2004,15(8):1182-1188
为了提高个性化推荐的质量,简化推荐规则生成过程中相关参数的设置,讨论了应用于个性化推荐中的关联规则的性质,定义了"推荐非空率"这一新的推荐测度以及"1-支持频繁项集"和"k最大关联规则"的概念,提出了"在1-支持频繁项集中生成k最大关联规则"的思想,设计了满足该思想且适合于不同滑动窗口深度下推荐的关联规则挖掘算法.理论分析及实验结果表明,该算法具有最大的推荐非空率、较高的推荐准确率和F-测度,并有效地简化了规则挖掘过程中阈值的设置.  相似文献   

11.
Association rule mining has contributed to many advances in the area of knowledge discovery. However, the quality of the discovered association rules is a big concern and has drawn more and more attention recently. One problem with the quality of the discovered association rules is the huge size of the extracted rule set. Often for a dataset, a huge number of rules can be extracted, but many of them can be redundant to other rules and thus useless in practice. Mining non-redundant rules is a promising approach to solve this problem. In this paper, we first propose a definition for redundancy, then propose a concise representation, called a Reliable basis, for representing non-redundant association rules. The Reliable basis contains a set of non-redundant rules which are derived using frequent closed itemsets and their generators instead of using frequent itemsets that are usually used by traditional association rule mining approaches. An important contribution of this paper is that we propose to use the certainty factor as the criterion to measure the strength of the discovered association rules. Using this criterion, we can ensure the elimination of as many redundant rules as possible without reducing the inference capacity of the remaining extracted non-redundant rules. We prove that the redundancy elimination, based on the proposed Reliable basis, does not reduce the strength of belief in the extracted rules. We also prove that all association rules, their supports and confidences, can be retrieved from the Reliable basis without accessing the dataset. Therefore the Reliable basis is a lossless representation of association rules. Experimental results show that the proposed Reliable basis can significantly reduce the number of extracted rules. We also conduct experiments on the application of association rules to the area of product recommendation. The experimental results show that the non-redundant association rules extracted using the proposed method retain the same inference capacity as the entire rule set. This result indicates that using non-redundant rules only is sufficient to solve real problems needless using the entire rule set.  相似文献   

12.
李乃乾  沈钧毅 《计算机工程》2002,28(11):13-14,22
提出了一种新的基于模糊概念的量化关联规则挖掘方法,该方法利用在量化属性域上定义的一组模糊概念表示属性间的关联关系,克服了传统的离散分区法的不足,使得规则的表示自然,简明,有利于专家理解,同时,给出了挖掘算法。  相似文献   

13.
为了易于产生候选频繁项目集和计算项目集的支持数,提出了基于二进制的关联规则挖掘算法,但在搜索候选频繁项目集时仍从集合论出发,沿用传统搜索超集或子集的方法,在一定程度上效率受到了限制;为此提出了一种基于二进制的交叉挖掘关联规则算法,通过数值的递增和递减交叉方式自动产生候选频繁项集,缩短了候选频繁项的搜索空间,并在计算支持数时通过数字特征减少了扫描事务的个数,算法的效率得到了明显提高;该实验结果表明:与现有的二进制关联规则挖掘算法相比,算法是快速而有效的。  相似文献   

14.
实用关联规则挖掘算法的研究和实现   总被引:4,自引:0,他引:4  
关联规则挖掘是数据挖掘的主要方式之一。如何挖掘实用、有趣的关联规则已引起了众多学者的注意, 由于至今没有形成一个统一的标准,本文从删除冗余规则和引入“相关度”这个概念两个方面对实用关 联规则的挖掘算法进行了初步研究,最后对挖掘算法的运行状况进行了比较和分析。  相似文献   

15.
We consider the problem of finding association rules in a database with binary attributes. Most algorithms for finding such rules assume that all the data is available at the start of the data mining session. In practice, the data in the database may change over time, with records being added and deleted. At any given time, the rules for the current set of data are of interest. The naive, and highly inefficient, solution would be to rerun the association generation algorithm from scratch following the arrival of each new batch of data. This paper describes the Borders algorithm, which provides an efficient method for generating associations incrementally, from dynamically changing databases. Experimental results show an improved performance of the new algorithm when compared with previous solutions to the problem.  相似文献   

16.
数据库中加权关联规则的发现   总被引:66,自引:0,他引:66  
关联规则发现是数据库中知识发现研究中的热点课题,有着广泛的应用领域.在现有的研究中,数据库中的各个项目是按平等一致的方式加以处理的.然而,在现实世界数据库中却并非如此,不同的项目往往有着不同的重要性.为了将它们反映出来,对项目引入权值,从而提出了新的加权关联规则问题.由于项目权值的引入,频繁项目集的子集不再一定是频繁的.为此,又提出了项目的k-支持期望概念,并由此提出了加权关联规则的发现算法.  相似文献   

17.
一种改进的关联规则挖掘方法研究   总被引:4,自引:0,他引:4  
徐勇  周森鑫 《微机发展》2006,16(3):77-79
关联模式挖掘研究是数据挖掘研究领域的重要分支之一,旨在发现模式之间存在的关联或相关关系。然而,传统的基于支持度-可信度框架的挖掘方法存在着一些不足:一是会产生过多的模式(包括频繁项集和规则);二是挖掘出来的规则有些是用户不感兴趣的、无用的,甚至是错误的。所以在挖掘过程中能有效地对无用模式进行剪枝是必要的。利用相关关系对模式进行评价是一种有效的剪枝方法。实验结果分析表明,在传统挖掘方法的基础上引入相关关系度量可以有效地对非相关模式进行剪枝,从而减小频繁项集和规则的规模。  相似文献   

18.
Rare association rules correspond to rare, or infrequent, itemsets, as opposed to frequent ones that are targeted by conventional pattern miners. Rare rules reflect regularities of local, rather than global, scope that can nevertheless provide valuable insights to an expert, especially in areas such as genetics and medical diagnosis where some specific deviations/illnesses occur only in a small number of cases. The work presented here is motivated by the long-standing open question of efficiently mining strong rare rules, i.e., rules with high confidence and low support. We also propose an efficient solution for finding the set of minimal rare itemsets. This set serves as a basis for generating rare association rules.  相似文献   

19.
针对当前高校图书馆文献检索系统不能面向不同读者提供个性化检索服务的弱点,进行文献个性化检索的研究,提出将关联规则运用于对原始检索结果集按照读者层次进行个性化排序的设想,并以某高校图书馆的数据为例,详细描述利用改进的关联规则算法挖掘历史借阅数据,然后利用挖掘结果进行排序的过程,理论和实验验证将关联规则应用在文献个性化检索中的可行性。  相似文献   

20.
基于多维标度的快速挖掘关联规则算法   总被引:13,自引:0,他引:13  
挖掘关联规则是数据挖掘研究的一个重要方面.文章在分析其基本模型和研究多维标度基本性质的基础上,提出一个新的基于多维标度的挖掘关联规则算法.该算法以数据项间的关联度量为依据,将各个数据项投影到多维空间上,进行降维处理,最后将数据项集间的关联关系以可视结果提供给用户.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号