首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 80 毫秒
1.
关联规则挖掘是数据挖掘领域中的重要研究内容之一。然而,传统的基于支持度-可信度框架的挖掘方法可能会产生大量不相关、甚至是误导的关联规则。针对现有关联规则挖掘的评价标准存在的问题,提出在评价标准中增加兴趣度,并给出了兴趣度的定义和基于兴趣度的关联规则挖掘算法。利用兴趣度将关联规则分为正关联规则和负关联规则,从而可以用算法挖掘带有负项的关联规则。实验结果分析表明,在传统挖掘方法的基础上引入兴趣度,可以有效地减少正关联规则的规模,产生有意义的负关联规则。  相似文献   

2.
关联规则挖掘是数据挖掘领域中的重要研究内容之一。然而,传统的基于支持度-可信度框架的挖掘方法可能会产生大量不相关、甚至是误导的关联规则。针对现有关联规则挖掘的评价标准存在的问题,提出在评价标准中增加兴趣度,并给出了兴趣度的定义和基于兴趣度的关联规则挖掘算法。利用兴趣度将关联规则分为正关联规则和负关联规则,从而可以用算法挖掘带有负项的关联规则。实验结果分析表明,在传统挖掘方法的基础上引入兴趣度,可以有效地减少正关联规则的规模,产生有意义的负关联规则。  相似文献   

3.
基于兴趣度的关联规则挖掘算法   总被引:4,自引:0,他引:4  
马建庆  钟亦平  张世永 《计算机工程》2006,32(17):121-122,149
分析了Apriori核心算法,举例说明了其设计思想上的不足,并重新定义了关联规则形式和引进了兴趣度的概念。主要定义了合理的兴趣度,即基于可信度和支持度方差的兴趣度InterestR=[(CR-SRH)/4]^*(CR+SRH),并因此而设计了基于此兴趣度定义的关联规则挖掘算法,并对算法做了适当的分析。  相似文献   

4.
通过查阅相关文献资料,收集整理了基于概率兴趣度模型、差异思想兴趣度模型、相关性兴趣度模型、信息量兴趣度模型、影响兴趣度模型的计算公式,并利用Visual FoxPro编程语言实现这些兴趣度模型的关联规则挖掘算法。通过实验分析了各种兴趣度模型的取值与规则显示间的关系,并简要分析总结了各种兴趣度模型的基本特点。  相似文献   

5.
基于兴趣度的时态关联规则挖掘算法   总被引:1,自引:1,他引:1  
关联规则挖掘是数据挖掘研究中的一个重要方面,给出了一个关联规则中事件所包含信息的模型,在此基础上,提出了一种基于兴趣度的时态关联规则挖掘算法。该算法较好地弥补了应用模板匹配方法筛选基于兴趣度的关联规则时主观性太强,兴趣度阈值的定义过于简单,所挖掘出来的关联规则没有体现时态约束的缺陷。最后,将该算法应用到了股票数据的趋势挖掘中,得到了满意的实验结果。  相似文献   

6.
经典Apriori关联规则挖掘算法需要多次扫描整个事务数据库,产生庞大的候选集。文章提出基于Apriori的IOIR算法,算法根据用户的兴趣,有选择的挖掘数据库,并通过对每个候选集进行支持数排序,从而减少扫描的数据量和扫描的时间。  相似文献   

7.
关联分类具有较高的分类精度和较强的适应性,然而由于分类器是由一组高置信度的规则构成,有时会存在过度拟合问题。提出了基于规则兴趣度的关联分类(ACIR)。它扩展了TD-FP-growth算法,使之有效地挖掘训练集,产生满足最小支持度和最小置信度的有趣的规则。通过剪枝选择一个小规则集构造分类器。在规则剪枝过程中,采用规则兴趣度来评价规则的质量,综合考虑规则的预测精度和规则中项的兴趣度。实验结果表明该方法在分类精度上优于See5、CBA和CMAR,并且具有较好的可理解性和扩展性。  相似文献   

8.
一种基于兴趣度的大型数据库关联规则挖掘方法   总被引:1,自引:0,他引:1  
数据库关联规则挖掘是数据挖掘研究中一个重要研究课题,但该方法本身存在不足,对于大型数据库,可能产生数以千计的规则,使用户感到无所适从.本文提出对关联规则进行分类的思想,并给出了基于数据统计特性的带兴趣度的关联规则挖掘算法GRMiner和IRMiner,算法实现简单,分析表明该算法是有效的.  相似文献   

9.
基于启发式的隐私保护关联规则挖掘算法常通过删除项或增加项改变规则的支持度,现有的通过删除项的隐私保护关联规则挖掘算法设计过程中通常忽略了兴趣度和规则的左件,导致对非敏感规则的支持度和数据可用性影响很大。针对上述不足,在算法设计过程中引入了兴趣度和逐步移项的思想,通过对敏感规则的左右件选择性地适当处理,不仅成功隐藏了指定隐私规则集,同时降低了对非敏感规则支持度的影响,提高了数据的可用性。理论和实验结果表明i,f-then算法具有较好的隐私性和高效性。  相似文献   

10.
关联规则是一种常见的知识表达形式。本文介绍了关联规则的提取模式和基于PS架构提取模式的不足;介绍了关联规则兴趣度的定义,包括客观兴趣度和主观兴趣度以及综合兴趣度。  相似文献   

11.
挖掘支持度和兴趣度最优的数量关联规则   总被引:4,自引:0,他引:4  
讨论了数量关联规则提取过程中的连续属性离散化方法和规则的有趣性问题,给出了数量关联规则的客观兴趣度的度量函数,提出用模板匹配方法挖掘用户感兴趣的规则,以解决数量关联规则有趣性的主观评测,研究了一种挖掘支持度和兴趣度最优的形如(A∈[v1,v2]∧)C1)推出C2(其中A为连续属性,C1、C2为类别属性)的数量关联规则方法,并将该方法应用于股市行情分析,实验结果表明是非常有效的.  相似文献   

12.
一般的关联规则发现算法使用的都是支持度、置信度框架.但是在增量的数据挖掘过程中,该类算法却需要不断改变支持度、置信度,使得算法本身效率下降,并缺乏可说服性,比如Apriori算法.为了解决该类问题,使用兴趣度框架对增量的数据进行了关联规则挖掘,比较了基于支持度、置信度框架的算法(如Apriori,FUP算法)和基于兴趣度的算法之间的优缺点.试验结果表明:兴趣度能够有效地筛选关联规则,在进行增量的数据挖掘的情况下得到的关联规则总是小于等于支持度、置信度(Aprori)算法挖掘出的规则.  相似文献   

13.
The discovery of quantitative association rules in large databases is considered an interesting and important research problem. Recently, different aspects of the problem have been studied, and several algorithms have been presented in the literature, among others in (Srikant and Agrawal, 1996; Fukuda et al., 1996a; Fukuda et al., 1996b; Yoda et al., 1997; Miller and Yang, 1997). An aspect of the problem that has so far been ignored, is its computational complexity. In this paper, we study the computational complexity of mining quantitative association rules.  相似文献   

14.
李乃乾  沈钧毅 《计算机工程》2002,28(11):13-14,22
提出了一种新的基于模糊概念的量化关联规则挖掘方法,该方法利用在量化属性域上定义的一组模糊概念表示属性间的关联关系,克服了传统的离散分区法的不足,使得规则的表示自然,简明,有利于专家理解,同时,给出了挖掘算法。  相似文献   

15.
关联规则的发现是整个数据挖掘课题中的重要组成部分。在归纳现有关联规则研究的基础上提出了事务间数值型关联规则的数据挖掘问题,并对该问题进行了定义。应用模糊理论和相关的数据挖掘技术,提出了解决该问题的E—QA算法,并以实例对算法可行性进行验证,指出了算法存在的一些问题以及今后解决这些问题的思路。  相似文献   

16.
一种基于矩阵的多值关联规则的挖掘算法   总被引:2,自引:0,他引:2  
关联规则是数据挖掘研究的主要模式之一,其中布尔型关联规则的挖掘已经有比较成熟的系统和方法,而多值关联规则的挖掘则不然。本文提出的QARMM算法利用矩阵存储数据,将频繁项目集的产生过程转化为项目集的关系矩阵中向量的运算过程,同时克服了SLIG算法和矩阵算法不能挖掘多值关联规则的弱点,只需运行一次便可挖掘出所有关联规则。实验证明,在等价的数据集上挖掘关联规则,QARMM算法比Apriori算法具有更高的效率。  相似文献   

17.
提出一种基于模糊理论的关联规则挖掘方法来处理数量属性,模糊理论能够实现数据的平滑过渡,使得挖掘出的关联规则具有高度的可理解性,给出了模糊关联规则的形式定义和挖掘算法.  相似文献   

18.
量化关联规则挖掘及算法   总被引:2,自引:0,他引:2  
提出了一种新的量化关联规则挖掘算法QAR及其增量式更新算法IUQAR.算法以模糊集理论为基础,利用模糊概念表示量化属性属性间的关联关系,克服了传统的离散分区方法的不足,使得规则的表示自然、简明,有利于专家理解。同时,给出的算法IUQAR,有效地解决了规则的维护问题。  相似文献   

19.
关联规则兴趣度问题研究   总被引:5,自引:0,他引:5       下载免费PDF全文
梅志芳  王建 《计算机工程》2010,36(1):38-39,42
经典的关联规则都是使用基于支持度和可信度的度量标准,但经过实践应用证明存在很多问题。为此,引入兴趣度作为关联规则的新度量标准,阐述当前重点研究的客观兴趣度,对PS公式进行探讨,提出它的优点和不足,在此基础上进行相关改进,克服了可信度与支持度框架的缺陷,具有优化关联规则挖掘的作用。  相似文献   

20.
影响关联规则挖掘的有趣性因素的研究   总被引:7,自引:2,他引:7  
关联规则挖掘是数据挖掘研究中的一个重要方面,而其中一个重要问题是对挖掘出的规则的感兴趣程度的评估。实际应用中可从数据源中挖掘出大量的规则,但这些规则中的大部分对用户来说是不一定感兴趣的。关联规则挖掘中的有趣性问题可从客观和主观两个方面对关联规则的兴趣度进行评测。利用模板将用户感兴趣的规则和不感兴趣的规则区分开,以此来完成关联规则有趣性的主观评测;在关联规则的置信度和支持度基础上对关联规则的有趣性的客观评测增加了约束。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号