共查询到19条相似文献,搜索用时 194 毫秒
1.
传统的关联规则挖掘研究事务中所包含的项与项之间的关联性,而负关联规则挖掘不仅要考虑事务中包含的项,还要考虑事务中不包含的项。给出了完全负关联规则的定义,提出一种基于树的算法Free-PNP,通过此算法挖掘数据库中的负频繁模式,继而得到所要挖掘的完全负关联规则。通过实验验证了算法的有效性。 相似文献
2.
3.
1 引言关联规则是指包含了一组对象间特定关联关系的规则。由于关联规则的挖掘有着广阔的应用背景,因此,人们对关联规则的挖掘算法作了大量的研究。从离散的布尔型变量、枚举型变量分析到连续的数值型变量分析;从平面的单事务项内部关系的分析到立体N维的多事务项之间关系的分析;从集中式的整体的静 相似文献
4.
数据挖掘是目前数据库研究的一个重要方向。关于挖掘关联规则,其主要目标是从给定的事务库挖掘出类似XY形式的规则,X和Y都是事务库中事务所含有的项(item),并且规则需达到一定的支持度(support)和可信度(confidence)。支持度是指同时包含x和Y的事务占全部事务的百分比,可信度指包含X和Y的事务占包含X的事务的百分比。 相似文献
5.
一种简单的基于隐私保护的关联规则挖掘方法 总被引:1,自引:0,他引:1
为了提高对隐私数据的保护程度和挖掘结果的准确性,提出一种有效的隐私保护关联规则挖掘方法。针对关联规则挖掘中需预先给出最小支持度和最小置信度这一条件,提出了一种简单的事务数据库中事务的处理方法,即隐藏那些包含敏感项目的关联规则的方法,对相关事务作处理,达到隐藏包含敏感项目的关联规则的目的。理论分析和实验结果均表明,基于事务处理的隐私保护关联规则挖掘方法具有很好的隐私性、简单性和适用性。 相似文献
6.
7.
传统关联规则挖掘是在整个事务数据库的时间范围内进行的,但有时用户想得到某一特定时间范围(如商品的促销阶段)内的关联规则,该文对这一问题进行了详细讨论,提出了基于定制时间的时态支持度、时态频繁项集、时态置信度、时态关联规则等概念,在传统Apriori算法的基础上提出了挖掘时态频繁项集的算法。另一方面,讨论了当同时考虑正、负关联规则出现的矛盾规则问题以及用相关性解决这一问题的方法,提出了挖掘正负时态关联规则的算法,实例说明了算法的执行过程及有效性。 相似文献
8.
在研究负关联规则相关特性的基础上,将向量内积引入到该领域,提出了一种基于向量内积的多最小支持度正负关联规则挖掘算法。考虑到事务数据库中各项集分布不均而导致的单一最小支持度难以设定的问题,采用了多最小支持度策略,设计了一种能同时挖掘出频繁与非频繁项集,以及从这些项集中挖掘出正负关联规则的算法。实验结果表明,该算法仅需扫描一次数据库,且具有动态剪枝,不保留中间候选项和节省大量内存等优点,对事务数据库中负关联规则的挖掘具有重要意义。 相似文献
9.
一种含负项目的一般化关联规则挖掘算法 总被引:3,自引:0,他引:3
传统的关联规则是形如A→B反映正项目之间关联关系的蕴涵式,它无法反映出数据之间隐藏的负关联关系.在表达式中引入负项目,将这种传统的关联规则扩展成包含正、负项目的一般化关联规则.介绍了一般化关联规则的概念及其相关性质定理,并加以证明,提出了一种基于频繁模式树的挖掘混合正、负项目的一般化关联规则的MGPNFP算法,对其性能进行了分析,并比较了MGPNFP算法比现有的挖掘含负项目关联规则的算法所具有的优势. 相似文献
10.
关联规则采掘是数据挖掘中的重要课题,针对当前关联规则采掘中可能产生许多无效关联规则的问题,分析其原因,引入了紧密度的概率,通过此约束值,将事务集中两者紧密相联的项或是在很大程度上是紧密相联系的事务挖掘出来,其主导思想是一种事务的出现必然导致或大部分另一种事务的出现,根据此紧密性关联关系,将关联规则分为紧密性、高紧密性和非紧密性的关联关系。并对事务项进行实验分析,实验数据表明,新方法能减少无效的,非紧密的项集。 相似文献
11.
Mining Informative Rule Set for Prediction 总被引:2,自引:0,他引:2
Mining transaction databases for association rules usually generates a large number of rules, most of which are unnecessary when used for subsequent prediction. In this paper we define a rule set for a given transaction database that is much smaller than the association rule set but makes the same predictions as the association rule set by the confidence priority. We call this rule set informative rule set. The informative rule set is not constrained to particular target items; and it is smaller than the non-redundant association rule set. We characterise relationships between the informative rule set and non-redundant association rule set. We present an algorithm to directly generate the informative rule set without generating all frequent itemsets first that accesses the database less frequently than other direct methods. We show experimentally that the informative rule set is much smaller and can be generated more efficiently than both the association rule set and non-redundant association rule set. 相似文献
12.
13.
关联规则挖掘主要用于发现事务数据集中项与项之间的关系,现有的关联规则挖掘算法多是挖掘一种静态的关联规则,实际上规则随着时间的推移可能会有很大变化,为规则建立元规则对其支持度和置信度变化趋势进行分析和预测,有利于进一步指导挖掘和决策。通过一个实例介绍了一种基于马尔可夫模型的预测和分析的元规则的具体方法,并通过与其他方法的对比说明它是一个合理的模型。 相似文献
14.
15.
针对交易数据库中数据项重要性不同的现象,引入加权支持度和最小支持期望的概念,提出一种基于关联图的加权关联规则模型,并在该模型基础上,设计了改进的加权关联规则挖掘算法。该算法扫描数据库仅一次,采用关联图存储频繁2项集信息,通过构建基于图的剪枝策略,减少验证频繁项集的计算量,有效提高加权频繁项集的生成效率。 相似文献
16.
传统关联规则挖掘算法往往会产生过多规则而难以被决策者所采用。针对该问题,文章从应用的角度提出了最简有效关联规则,其特点是采用以后项为导向的挖掘方式,同时追求规则前后项之间的相关性,在此基础上给出了一种最简有效关联规则挖掘算法。利用该算法得到的最筒有效关联规则集包括的规则数量大为减少且能得出与全部有效关联规则集相同的决策,避免了大量的冗余挖掘及无效挖掘,提高了挖掘效率和应用效果。 相似文献
17.
18.
关联规则挖掘算法的改进 总被引:2,自引:1,他引:2
为了提供一种更加准确高效的关联规则算法,在传统的Apriori算法的基础上引入分而治之的理念和加权的思想。先把数据库分成互不相交的块,根据需求分析从每一个块中产生用户感兴趣的子集,把所有的子集合并成挖掘对象,再利用普通的关联规则算法产生频繁项集,最后在该项集的基础上产生加权频繁项集。该算法基本上克服了传统Apriori算法的缺点,从而大大地提高了运算效率,最大限度解决了“项集生成瓶颈”问题,并且使得生成的关联规则更加科学、准确。 相似文献