首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 194 毫秒
1.
传统的关联规则挖掘研究事务中所包含的项与项之间的关联性,而负关联规则挖掘不仅要考虑事务中包含的项,还要考虑事务中不包含的项。给出了完全负关联规则的定义,提出一种基于树的算法Free-PNP,通过此算法挖掘数据库中的负频繁模式,继而得到所要挖掘的完全负关联规则。通过实验验证了算法的有效性。  相似文献   

2.
基于频繁模式树的负关联规则挖掘算法   总被引:1,自引:0,他引:1       下载免费PDF全文
典型的正关联规则仅考虑事务中所列举的项目。负关联规则不但要考虑事务中所包含的项目集,还必需考虑事务中所不包含的项目,它包含了非常有价值的信息。然而,对于负关联规则的研究却很少,仅有的几种算法也存在一定的局限性。为此,该文提出了一种基于FP-tree的负关联规则挖掘算法,该算法不但可以发现事务数据库中所有的负关联规则,而且整个过程只需扫描事务数据库两次,算法是有效和可行的。  相似文献   

3.
1 引言关联规则是指包含了一组对象间特定关联关系的规则。由于关联规则的挖掘有着广阔的应用背景,因此,人们对关联规则的挖掘算法作了大量的研究。从离散的布尔型变量、枚举型变量分析到连续的数值型变量分析;从平面的单事务项内部关系的分析到立体N维的多事务项之间关系的分析;从集中式的整体的静  相似文献   

4.
数据挖掘是目前数据库研究的一个重要方向。关于挖掘关联规则,其主要目标是从给定的事务库挖掘出类似XY形式的规则,X和Y都是事务库中事务所含有的项(item),并且规则需达到一定的支持度(support)和可信度(confidence)。支持度是指同时包含x和Y的事务占全部事务的百分比,可信度指包含X和Y的事务占包含X的事务的百分比。  相似文献   

5.
一种简单的基于隐私保护的关联规则挖掘方法   总被引:1,自引:0,他引:1  
为了提高对隐私数据的保护程度和挖掘结果的准确性,提出一种有效的隐私保护关联规则挖掘方法。针对关联规则挖掘中需预先给出最小支持度和最小置信度这一条件,提出了一种简单的事务数据库中事务的处理方法,即隐藏那些包含敏感项目的关联规则的方法,对相关事务作处理,达到隐藏包含敏感项目的关联规则的目的。理论分析和实验结果均表明,基于事务处理的隐私保护关联规则挖掘方法具有很好的隐私性、简单性和适用性。  相似文献   

6.
基于隐私保护的关联规则挖掘算法   总被引:2,自引:0,他引:2       下载免费PDF全文
张瑞  郑诚 《计算机工程》2009,35(4):78-79
数据挖掘中的关联规则反映一个事件和其他事件之间依赖或相互关联的知识,其中涉及隐私保护方面的问题。该文提出一种基于隐私保护的关联规则挖掘算法及其事务修改算法PPARM,通过对包含敏感项的相关事务做适当的处理,有效地隐藏该类敏感规则。理论分析和实验结果表明,该挖掘算法简单,且具有很好的隐私保护性。  相似文献   

7.
传统关联规则挖掘是在整个事务数据库的时间范围内进行的,但有时用户想得到某一特定时间范围(如商品的促销阶段)内的关联规则,该文对这一问题进行了详细讨论,提出了基于定制时间的时态支持度、时态频繁项集、时态置信度、时态关联规则等概念,在传统Apriori算法的基础上提出了挖掘时态频繁项集的算法。另一方面,讨论了当同时考虑正、负关联规则出现的矛盾规则问题以及用相关性解决这一问题的方法,提出了挖掘正负时态关联规则的算法,实例说明了算法的执行过程及有效性。  相似文献   

8.
在研究负关联规则相关特性的基础上,将向量内积引入到该领域,提出了一种基于向量内积的多最小支持度正负关联规则挖掘算法。考虑到事务数据库中各项集分布不均而导致的单一最小支持度难以设定的问题,采用了多最小支持度策略,设计了一种能同时挖掘出频繁与非频繁项集,以及从这些项集中挖掘出正负关联规则的算法。实验结果表明,该算法仅需扫描一次数据库,且具有动态剪枝,不保留中间候选项和节省大量内存等优点,对事务数据库中负关联规则的挖掘具有重要意义。  相似文献   

9.
一种含负项目的一般化关联规则挖掘算法   总被引:3,自引:0,他引:3  
张玉芳  彭燕  刘君  陈铭灏 《计算机工程与设计》2006,27(20):3904-3908,3934
传统的关联规则是形如A→B反映正项目之间关联关系的蕴涵式,它无法反映出数据之间隐藏的负关联关系.在表达式中引入负项目,将这种传统的关联规则扩展成包含正、负项目的一般化关联规则.介绍了一般化关联规则的概念及其相关性质定理,并加以证明,提出了一种基于频繁模式树的挖掘混合正、负项目的一般化关联规则的MGPNFP算法,对其性能进行了分析,并比较了MGPNFP算法比现有的挖掘含负项目关联规则的算法所具有的优势.  相似文献   

10.
关联规则采掘是数据挖掘中的重要课题,针对当前关联规则采掘中可能产生许多无效关联规则的问题,分析其原因,引入了紧密度的概率,通过此约束值,将事务集中两者紧密相联的项或是在很大程度上是紧密相联系的事务挖掘出来,其主导思想是一种事务的出现必然导致或大部分另一种事务的出现,根据此紧密性关联关系,将关联规则分为紧密性、高紧密性和非紧密性的关联关系。并对事务项进行实验分析,实验数据表明,新方法能减少无效的,非紧密的项集。  相似文献   

11.
Mining Informative Rule Set for Prediction   总被引:2,自引:0,他引:2  
Mining transaction databases for association rules usually generates a large number of rules, most of which are unnecessary when used for subsequent prediction. In this paper we define a rule set for a given transaction database that is much smaller than the association rule set but makes the same predictions as the association rule set by the confidence priority. We call this rule set informative rule set. The informative rule set is not constrained to particular target items; and it is smaller than the non-redundant association rule set. We characterise relationships between the informative rule set and non-redundant association rule set. We present an algorithm to directly generate the informative rule set without generating all frequent itemsets first that accesses the database less frequently than other direct methods. We show experimentally that the informative rule set is much smaller and can be generated more efficiently than both the association rule set and non-redundant association rule set.  相似文献   

12.
最简关联规则及其挖掘算法   总被引:3,自引:0,他引:3       下载免费PDF全文
李杰  徐勇  王云峰  王友 《计算机工程》2007,33(13):46-48
传统关联规则挖掘算法往往产生过多规则而难以被决策者所采用。针对该问题,文章从应用的角度提出了最简关联规则,其特点是后项只包括一种产品,同时追求规则前项产品项数的最小化,在此基础上给出了一种最简关联规则挖掘算法。利用该算法得到的最简关联规则集包括的规则数量大为减少且能得出与全部关联规则集相同的决策,避免了大量的冗余挖掘,提高了挖掘效率和应用效果。  相似文献   

13.
关联规则挖掘主要用于发现事务数据集中项与项之间的关系,现有的关联规则挖掘算法多是挖掘一种静态的关联规则,实际上规则随着时间的推移可能会有很大变化,为规则建立元规则对其支持度和置信度变化趋势进行分析和预测,有利于进一步指导挖掘和决策。通过一个实例介绍了一种基于马尔可夫模型的预测和分析的元规则的具体方法,并通过与其他方法的对比说明它是一个合理的模型。  相似文献   

14.
加权关联规则算法存在2个不足:(1)不满足向下封闭性要求,即频繁集的子集未必是频繁集;(2)加权关联规则不能很好地处理不同项目的不同重要性,真正地体现不同项目重要性的不同。针对上述问题,提出一种动态加权关联规则算法,算法根据项目的重要性和最大频繁项目集数量确定项目不同阶段的不同权重,充分体现不同项目的重要性是不同的,从而使算法的向下封闭性得到证明。实验结果表明,该算法具有较高的准确性及效率。  相似文献   

15.
陈文 《计算机工程》2010,36(13):59-61
针对交易数据库中数据项重要性不同的现象,引入加权支持度和最小支持期望的概念,提出一种基于关联图的加权关联规则模型,并在该模型基础上,设计了改进的加权关联规则挖掘算法。该算法扫描数据库仅一次,采用关联图存储频繁2项集信息,通过构建基于图的剪枝策略,减少验证频繁项集的计算量,有效提高加权频繁项集的生成效率。  相似文献   

16.
传统关联规则挖掘算法往往会产生过多规则而难以被决策者所采用。针对该问题,文章从应用的角度提出了最简有效关联规则,其特点是采用以后项为导向的挖掘方式,同时追求规则前后项之间的相关性,在此基础上给出了一种最简有效关联规则挖掘算法。利用该算法得到的最筒有效关联规则集包括的规则数量大为减少且能得出与全部有效关联规则集相同的决策,避免了大量的冗余挖掘及无效挖掘,提高了挖掘效率和应用效果。  相似文献   

17.
将T检验思想引入隐私保护数据挖掘算法,提出基于影响度的隐私保护关联规则挖掘算法.将影响度作为关联规则生成准则,以减少冗余规则和不相关规则,提高挖掘效率;通过调整事务间敏感关联规则的项目,实现敏感规则隐藏.实验结果表明,该算法能使规则损失率和增加率降低到6%以下.  相似文献   

18.
关联规则挖掘算法的改进   总被引:2,自引:1,他引:2  
为了提供一种更加准确高效的关联规则算法,在传统的Apriori算法的基础上引入分而治之的理念和加权的思想。先把数据库分成互不相交的块,根据需求分析从每一个块中产生用户感兴趣的子集,把所有的子集合并成挖掘对象,再利用普通的关联规则算法产生频繁项集,最后在该项集的基础上产生加权频繁项集。该算法基本上克服了传统Apriori算法的缺点,从而大大地提高了运算效率,最大限度解决了“项集生成瓶颈”问题,并且使得生成的关联规则更加科学、准确。  相似文献   

19.
最大利润项集选择是关联规则的一个具体应用.频繁项集可以反映出事务中商品项的销售是相互关联的,若从商品项集合中去掉与其他项有强关联的项,则必然会导致商品销售关联性的变化,从而导致销售利润的损失.丢失规则的提出可以量化这种利润损失的计算,为保证利润最大化,就必须对保留项集进行选择.最大利润项集选择问题是一个典型的NP难度问题,可以利用已知的二次规划NP完全问题来解决.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号