首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 62 毫秒
1.
经典Apriori关联规则挖掘算法需要多次扫描整个事务数据库,产生庞大的候选集。文章提出基于Apriori的IOIR算法,算法根据用户的兴趣,有选择的挖掘数据库,并通过对每个候选集进行支持数排序,从而减少扫描的数据量和扫描的时间。  相似文献   

2.
关联规则挖掘是数据挖掘领域中的重要研究内容之一。然而,传统的基于支持度-可信度框架的挖掘方法可能会产生大量不相关、甚至是误导的关联规则。针对现有关联规则挖掘的评价标准存在的问题,提出在评价标准中增加兴趣度,并给出了兴趣度的定义和基于兴趣度的关联规则挖掘算法。利用兴趣度将关联规则分为正关联规则和负关联规则,从而可以用算法挖掘带有负项的关联规则。实验结果分析表明,在传统挖掘方法的基础上引入兴趣度,可以有效地减少正关联规则的规模,产生有意义的负关联规则。  相似文献   

3.
关联规则挖掘是数据挖掘领域中的重要研究内容之一。然而,传统的基于支持度-可信度框架的挖掘方法可能会产生大量不相关、甚至是误导的关联规则。针对现有关联规则挖掘的评价标准存在的问题,提出在评价标准中增加兴趣度,并给出了兴趣度的定义和基于兴趣度的关联规则挖掘算法。利用兴趣度将关联规则分为正关联规则和负关联规则,从而可以用算法挖掘带有负项的关联规则。实验结果分析表明,在传统挖掘方法的基础上引入兴趣度,可以有效地减少正关联规则的规模,产生有意义的负关联规则。  相似文献   

4.
一直以来,关联规则挖掘算法主要基于支持度-可信度构架,但这样的算法有一个固有的缺陷,不能对非频繁项进行研究,而在许多实际应用中,如相似Web文档的识别。灾害预防,往往需要对高度关联的项集进行分析,即使它不是频繁出现的,放弃支持度,只使用可信度的关联规则挖掘算法将有利于这一问题的解决,这是一个新的研究方向。在对传统的关联规则挖掘算法进行了简单介绍后,主要介绍了基于可信度构架的关联规则挖掘算法,并对它们进行了分析与评价。  相似文献   

5.
杨泽民 《计算机科学》2013,40(3):259-262
为了解决关联规则挖掘算法中频繁集信息挖掘不完善和时序周期对事务集频繁项挖掘的影响问题,提出了一种基于时序和兴趣度约束的加权关系规则挖掘算法。该算法首先利用时序滑动函数对时序事务集进行发生概率估算和权值赋值,依据兴趣度约束函数和剪枝定理进行事务集化简,然后根据支持度和寿支持期望进行加权频繁事务集抽取,最后依据置信度进行加权关联规则导出。实验结果证明,该算法能够快速有效地挖掘出符合用户兴趣度的关联规则。  相似文献   

6.
基于兴趣度的时态关联规则挖掘算法   总被引:1,自引:1,他引:1  
关联规则挖掘是数据挖掘研究中的一个重要方面,给出了一个关联规则中事件所包含信息的模型,在此基础上,提出了一种基于兴趣度的时态关联规则挖掘算法。该算法较好地弥补了应用模板匹配方法筛选基于兴趣度的关联规则时主观性太强,兴趣度阈值的定义过于简单,所挖掘出来的关联规则没有体现时态约束的缺陷。最后,将该算法应用到了股票数据的趋势挖掘中,得到了满意的实验结果。  相似文献   

7.
通过查阅相关文献资料,收集整理了基于概率兴趣度模型、差异思想兴趣度模型、相关性兴趣度模型、信息量兴趣度模型、影响兴趣度模型的计算公式,并利用Visual FoxPro编程语言实现这些兴趣度模型的关联规则挖掘算法。通过实验分析了各种兴趣度模型的取值与规则显示间的关系,并简要分析总结了各种兴趣度模型的基本特点。  相似文献   

8.
基于启发式的隐私保护关联规则挖掘算法常通过删除项或增加项改变规则的支持度,现有的通过删除项的隐私保护关联规则挖掘算法设计过程中通常忽略了兴趣度和规则的左件,导致对非敏感规则的支持度和数据可用性影响很大。针对上述不足,在算法设计过程中引入了兴趣度和逐步移项的思想,通过对敏感规则的左右件选择性地适当处理,不仅成功隐藏了指定隐私规则集,同时降低了对非敏感规则支持度的影响,提高了数据的可用性。理论和实验结果表明i,f-then算法具有较好的隐私性和高效性。  相似文献   

9.
关联挖掘的目的是从大量数据中发现对用户有用、新颖、重要的关联规则。传统的关联挖掘算法会产生大量对用户而言显而易见的平凡规则,使那些真正对用户有用的新颖规则被淹没,而一些针对新颖性的改进算法往往又存在先验知识表达复杂且工作量极大的问题。在本文中,我们运用简单的分类树,引入“新颖度”的概念,对Apriori算法进行改进,得到了基于“新颖度”的关联挖掘算法,此算法既充分考虑了挖掘过程中得新颖性问题,又克服了先验知识表达过于复杂的困难。  相似文献   

10.
关联规则的高效挖掘算法研究   总被引:4,自引:0,他引:4  
关联规则的挖掘是一个重要的数据挖掘问题,对其挖掘算法的研究具有十分重要的意义,经典的关联规则发现算法是一个多次遍历的算法,计算的复杂度较同,本文给出一种关联规则频繁数据集的发现算法,只需对交易序列扫描两次即可发现数据采的频繁数据集,算法效率得到了较好地提高。  相似文献   

11.
基于综合度量的关联规则挖掘算法   总被引:2,自引:0,他引:2  
陆晶  赛英 《计算机工程》2004,30(22):89-90,131
从确定性,有用性,简洁性和新奇性4个方面对规则进行综合度量,给出了规则长度和兴趣度约束的定义,在传统算法基础上提出了基于综合度量的关联规则挖掘算法,使关联规则的挖掘质量得到提高。  相似文献   

12.
数据采集手段的丰富,使获取、保存大量数据变得容易,从庞杂的数据中提取有用的知识和信息是数据挖掘的主要任务,关联规则是数据挖掘领域的一个重要分支。本文针对事务数据库中增加新的数据集后相应关联规则的更新和维护问题,提出了一种关联规则增量式增量算法  相似文献   

13.
数据采集手段的丰富,使获取、保存大量数据变得容易,从庞杂的数据中提取有用的知识和信息是数据挖掘的主要任务,关联规则是数据挖掘领域的一个重要分支。本文针对事务数据库中增加新的数据集后相应关联规则的更新和维护问题,提出了一种关联规则增量式增量算法  相似文献   

14.
基于关联规则的数据挖掘技术的快速算法   总被引:11,自引:1,他引:11  
周剑雄  王明哲 《计算机工程》2003,29(12):48-49,92
提出了一种改进的Apriori算法的数据挖掘模式,探讨了对其中的生成候选频繁项目集、生成强关联规则等几个关健步骤运用标准SQL语言的算法实现。  相似文献   

15.
对于模式经常发生变化的客户资信评估、垃圾邮件检测和网络入侵检测等在线分类系统来说,自动感知客观存在的新类别,并让系统中的分类器对此作出自适应凋整是其正确持续运行必须解决的问题。该文提出了一种适应新类别增加的决策树训练算法,该算法在新类别已检出的前提下,在原有决策树基础上利用新类别样本增量训练出新的决策树。实验结果表明:该文提出的算法可以较好地解决该问题,而与重新训练新决策树相比,它在分类器离线调整上较少的时间花费使其适用于在线分类系统。  相似文献   

16.
一种基于约束的关联规则挖掘算法   总被引:1,自引:1,他引:0  
基于约束的关联规则挖掘是一种重要的关联挖掘,能按照用户给出的条件来实行有针对性的挖掘。大多数此类算法仅处理具有一种约束的挖掘,因而其应用受到一定程度的限制。提出一种新的基于约束的关联规则挖掘算法MCAL,它同时处理两种类型的约束:非单调性约束和单调性约束。算法包括3个步骤:第一步,挖掘当前数据集的频繁1项集;第二,应用约束的性质和有效剪枝策略来寻找约束点,同时生成频繁项的条件数据库;最后,递归地应用前面两步寻找条件数据库中频繁项的约束点,以生成满足约束的全部频繁项集。通过实验对比,无论从运行时间还是可扩展性来说,本算法均达到较好的效果。  相似文献   

17.
基于Apriori算法的水平加权关联规则挖掘   总被引:19,自引:2,他引:19  
关联规则挖掘可以发现大量数据中项集之间有趣的关联或相关联系,并已在许多领域得到了广泛的应用。目前业界已经提出了许多发现关联规则的算法,这些算法都认为每个数据对规则的重要性相同。但在实际应用中,用户会比较倾向于自己最感兴趣或认为最重要的那部分项目,因此有必要加强这些项目对规则的影响,同时减弱另一些用户兴趣不大或认为不重要的项目对规则的影响。为此,论文提出了水平加权关联规则的问题,并结合Apriori算法,加以改进,给出了关于该问题的解决方案及有效算法New_Apriori。  相似文献   

18.
加权布尔型关联规则的研究   总被引:11,自引:2,他引:11  
为了解决加权支持率可能大于1的不足,对属性的权重集归一化,并提出第1类加权关联规则挖掘算法。此算法能有效地考虑属性的权重,并且认为规则的重要性随着规则中所含属性数量的增加而增加;但在有些数据库中,挖掘关联规则只需考虑属性的权重,也就是说规则的重要性不随着规则中所含属性数量的增加而增加。该文通过对各个元素所作贡献的加权构造了一个加权数据库,提出了解决此类问题的第2类加权关联规则挖掘算法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号