首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
基于两级支持度的正、负关联规则挖掘   总被引:9,自引:0,他引:9  
当同时研究正、负关联规则时会遇到一些新问题,如非频繁项集的挖掘及如何避免产生自矛盾的规则等.该文对这些问题进行了深入的研究,设计了能够同时挖掘频繁项集与非频繁项集以及能够同时挖掘这些项集中的正、负关联规则算法,实验表明该算法是非常有效的。  相似文献   

2.
关联规则挖掘是数据挖掘领域中的重要研究内容之一。然而,传统的基于支持度-可信度框架的挖掘方法可能会产生大量不相关、甚至是误导的关联规则。针对现有关联规则挖掘的评价标准存在的问题,提出在评价标准中增加兴趣度,并给出了兴趣度的定义和基于兴趣度的关联规则挖掘算法。利用兴趣度将关联规则分为正关联规则和负关联规则,从而可以用算法挖掘带有负项的关联规则。实验结果分析表明,在传统挖掘方法的基础上引入兴趣度,可以有效地减少正关联规则的规模,产生有意义的负关联规则。  相似文献   

3.
关联规则挖掘是数据挖掘领域中的重要研究内容之一。然而,传统的基于支持度-可信度框架的挖掘方法可能会产生大量不相关、甚至是误导的关联规则。针对现有关联规则挖掘的评价标准存在的问题,提出在评价标准中增加兴趣度,并给出了兴趣度的定义和基于兴趣度的关联规则挖掘算法。利用兴趣度将关联规则分为正关联规则和负关联规则,从而可以用算法挖掘带有负项的关联规则。实验结果分析表明,在传统挖掘方法的基础上引入兴趣度,可以有效地减少正关联规则的规模,产生有意义的负关联规则。  相似文献   

4.
本文提出一种传统的关联规则挖掘主要着眼于正关联规则,即形如A→B的规则的挖掘,而对负关联规则的研究非常有限,然而实践表明在关联规则的各个应用领域中,负关联规则同正关联规则有着同样的重要性。Apriori算法是挖掘关联规则的一个经典算法,但是它只局限于挖掘正关联规则,本文对该算法进行改进提出了Ex-Apriori算法,新算法不仅能挖出负关联规则,而且由于兴趣度的引进,能够剔除大量无趣的关联规则。实验表明该种算法有效且可行。  相似文献   

5.
正、负关联规则间的置信度关系研究   总被引:5,自引:0,他引:5  
当同时研究项集A、B间的正、负关联规则(A→B、A→┐B、┐A→B及┐A→┐B)时,置信度的设置问题变得非常重要。当A,B的支持度变化时,四种关联规则的置信度如何变化,它们之间有着怎样的联系,对此进行了详细讨论,结论对置信度的设置有重要价值。  相似文献   

6.
基于最小提升率的正负关联规则挖掘   总被引:3,自引:0,他引:3  
给出了提升率的概念,并阐述了提升率的意义和作用。提出了基于支持度一提升率的正负关联规则挖掘模式。实验表明,采用该模式进行正负关联规则挖掘,所挖掘出的规则数量少,质量高,无虚假规则和相互矛盾的规则。  相似文献   

7.
基于兴趣度的关联规则挖掘算法   总被引:4,自引:0,他引:4  
马建庆  钟亦平  张世永 《计算机工程》2006,32(17):121-122,149
分析了Apriori核心算法,举例说明了其设计思想上的不足,并重新定义了关联规则形式和引进了兴趣度的概念。主要定义了合理的兴趣度,即基于可信度和支持度方差的兴趣度InterestR=[(CR-SRH)/4]^*(CR+SRH),并因此而设计了基于此兴趣度定义的关联规则挖掘算法,并对算法做了适当的分析。  相似文献   

8.
通过查阅相关文献资料,收集整理了基于概率兴趣度模型、差异思想兴趣度模型、相关性兴趣度模型、信息量兴趣度模型、影响兴趣度模型的计算公式,并利用Visual FoxPro编程语言实现这些兴趣度模型的关联规则挖掘算法。通过实验分析了各种兴趣度模型的取值与规则显示间的关系,并简要分析总结了各种兴趣度模型的基本特点。  相似文献   

9.
基于能同时处理多个属性间关联关系的多维关联规则算法,对大学生社交网络行为习惯的调查问卷进行研究分析,发现依靠支持度和置信度的关联规则算法有时会产生误导性的结果。针对关联规则存在的这一问题,给出了带有负向的关联规则兴趣度的解决办法,并发现兴趣度规则中减少关联规则计算量的性质,可极大提高了多维关联规则兴趣度算法在规则提取中的效率。实验结果表明,负向的关联规则置信度强于正向的关联规则置信度,引入兴趣度的多维关联规则算法的准确度更高。  相似文献   

10.
基于统计相关性的兴趣关联规则的挖掘   总被引:8,自引:0,他引:8  
本文首先对关联规则的支持—置信框架存在的不足进行了分析,然后引入了规则的兴趣度概念,利用兴趣度来约束冗余关联规则的产生,以提高挖掘知识的有用性,并给出了算法描述。  相似文献   

11.
传统关联规则挖掘是在整个事务数据库的时间范围内进行的,但有时用户想得到某一特定时间范围(如商品的促销阶段)内的关联规则,该文对这一问题进行了详细讨论,提出了基于定制时间的时态支持度、时态频繁项集、时态置信度、时态关联规则等概念,在传统Apriori算法的基础上提出了挖掘时态频繁项集的算法。另一方面,讨论了当同时考虑正、负关联规则出现的矛盾规则问题以及用相关性解决这一问题的方法,提出了挖掘正负时态关联规则的算法,实例说明了算法的执行过程及有效性。  相似文献   

12.
关联规则兴趣度问题研究   总被引:5,自引:0,他引:5       下载免费PDF全文
梅志芳  王建 《计算机工程》2010,36(1):38-39,42
经典的关联规则都是使用基于支持度和可信度的度量标准,但经过实践应用证明存在很多问题。为此,引入兴趣度作为关联规则的新度量标准,阐述当前重点研究的客观兴趣度,对PS公式进行探讨,提出它的优点和不足,在此基础上进行相关改进,克服了可信度与支持度框架的缺陷,具有优化关联规则挖掘的作用。  相似文献   

13.
正负关联规则量化方法   总被引:2,自引:0,他引:2       下载免费PDF全文
提出一种能够有效挖掘正、负关联规则的量化方法,介绍挖掘系统的整体架构,包括支持度和置信度,通过增加对比影响度,对其进行优化,从而提高有趣知识的挖掘效率。仿真实验结果表明,该方法可以剔除一些无效关联规则,弥补传统方法的不足,具有一定应用价值。  相似文献   

14.
一种改进的正负关联规则挖掘算法   总被引:1,自引:0,他引:1  
陈宁军  高志年 《计算机科学》2011,38(12):191-193,212
针对传统正负关联规则挖掘算法需要多次扫描数据库并且生成大量候选频繁项集的问题,在对比目前相关研究成果的基础上,提出了一种改进的正负关联规则挖掘算法,它通过两次数据扫描完成对正负关联规则的挖掘,对最大频繁项集的挖掘算法做了改进,有效提高了算法效率,同时对置信度标准做了改进。基于某真实事务集的实验表明,算法提高了规则挖掘的质量和有效性。  相似文献   

15.
兴趣度量在关联规则挖掘中常用来发现那些潜在的令人感兴趣的模式,基于FP树结构的FP-growth算法是目前较高效的关联规则挖掘算法之一,如果挖掘潜在的有价值的低支持度模式,这种算法效率较低。为此,本文提出一种新的兴趣度量—项项正相关兴趣度量,该量度具有良好的反单调性,所得到的模式中任意一项在事务中的出现均可提升模式中其余项出现的可能性。同时,提出一种改进的FP挖掘算法,该算法采用一种压缩的FP树结构,并利用非递归调用方法来减少挖掘中建立额外条件模式树的开销。更为重要的是,在频繁项集挖掘中引入项项正相关兴趣度量剪枝策略,有效过滤掉非正相关长模式和无效项集,扩大了可挖掘支持度阈值范围。实验结果表明,该算法是有效和可行的。  相似文献   

16.
如何根据用户当前的访问行为,预测他下一个感兴趣的商品,做出针对性的推荐成为电子商务的一个重要研究内容。文章提出了一种不需产生大量非频繁项集的关联规则挖掘算法,该算法利用相关性很好的改善了经典Apriori算法中存在大量冗余规则问题。最后通过实验证明了算法的有效性。  相似文献   

17.
多数据库中全局负关联规则挖掘研究   总被引:1,自引:0,他引:1  
全局负关联规则挖掘是多数据库关联信息挖掘的重要研究内容,具有广泛的应用范围和使用价值.合并各子数据库的负关联规则是现有全局负关联规则挖掘常用的方法,但数据密度大、规则不全面及运算时间高等问题影响了已有全局负关联规则挖掘方法的效率.本文给出一种新的全局负关联规则挖掘算法,其具体步骤为:(1)扫描各子数据库,建立多数据库频繁模式树;(2)依据频繁项集全局一致性原则,对多数据库频繁模式树执行精简操作;(3)在此基础上产生全局极小非频繁项集;(4)依据极大频繁项集向上闭包原则,产生全局非频繁项集;(5)在规则相关度的基础上提取全局负关联规则.大量的对比实验结果表明,本文算法具有快速发现全局负关联规则的能力.  相似文献   

18.
挖掘支持度和兴趣度最优的数量关联规则   总被引:4,自引:0,他引:4  
讨论了数量关联规则提取过程中的连续属性离散化方法和规则的有趣性问题,给出了数量关联规则的客观兴趣度的度量函数,提出用模板匹配方法挖掘用户感兴趣的规则,以解决数量关联规则有趣性的主观评测,研究了一种挖掘支持度和兴趣度最优的形如(A∈[v1,v2]∧)C1)推出C2(其中A为连续属性,C1、C2为类别属性)的数量关联规则方法,并将该方法应用于股市行情分析,实验结果表明是非常有效的.  相似文献   

19.
基于多最小支持度的关联规则挖掘   总被引:1,自引:0,他引:1  
分析了单最小支持度关联规则挖掘的局限性,提出了基于多最小支持度的关联规则挖掘模型,重点研究了多最小支持度MS.Apriori算法的基本思想,指出了算法的优缺点并通过实例说明发现频繁项集的方法,最后指出该算法的不足及改进算法.  相似文献   

20.
目前衡量和生成关联规则的主要准则是考虑支持度和置信度阈值,而在实际应用中仅按此准则来挖掘是不够的, 这主要是因为关联规则的评价标准不合理产生的. 针对关联规则评价指标进行了深入的研究, 分析了“支持度-置信度”架构的局限性, 提出了基于相关性的兴趣度的评价指标PS公式, 根据其数学特性指出了它的优点与不足, 为关联规则评价体系的改进奠定了理论基础.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号