首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 251 毫秒
1.
一种有效且无冗余的快速关联规则挖掘算法   总被引:8,自引:0,他引:8  
刘乃丽  李玉忱  马磊 《计算机应用》2005,25(6):1396-1397
关联规则的挖掘是数据挖掘的一个重要研究领域。传统算法进行关联规则挖掘时,或者生成规则的效率很低,或者生成的关联规则之间存在着大量的冗余,或者挖掘出的规则的支持度和置信度都很高,但却是无趣的、甚至是虚假的规则,且不能产生带有否定项的规则。提出了一种新的算法MVNR(MiningValidandnon RedundantAssociationRulesAlgorithm),利用频繁项集的极小子集集合很好的解决了上述问题。  相似文献   

2.
负关联规则反映了数据项之间的互斥关系,能提供很多有用的信息,在决策支持中起重要作用,但现行的挖掘算法主要是针对单一数据库的挖掘,多数据库中负关联规则的挖掘还未引起重视。该文介绍负关联规则的研究现状、主要挖掘方法以及冗余正负关联规则的修剪方法,对多数据库中关联规则挖掘研究现状和主要技术进行论述,并展望多数据库中负关联规则挖掘的发展趋势。  相似文献   

3.
将语词抽取、负关联规则挖掘和查询扩展技术应用于信息检索,提出一种基于语词抽取与负关联规则挖掘融合的信息检索系统模型及其算法.详细论述模型的设计思想、各模块的功能,以及模型的理论分析和检索算法.该模型能够将语词抽取、负关联规则挖掘和查询扩展三种技术融合,对初检文档集进行有效地处理,得到高质量的与原查询词相关的扩展词,和原查询组合成新查询,再进行二次检索,有效地解决了词不匹配的问题.实验结果表明,该模型有效,能改善和提高信息检索性能  相似文献   

4.
数据库中动态关联规则的挖掘   总被引:7,自引:0,他引:7       下载免费PDF全文
关联规则能挖掘变量间的相互依赖关系,但是不能反映规则本身的变化规律.为此本文提出了动态关联规则.首先将整个待挖掘数据集按时间划分成若干子集,每个子集挖掘得到的每条规则分别生成一个支持度和一个置信度,这样每条规则在全集上就对应了一个支持度向量和一个置信度向量.通过分析支持度向量和置信度向量,不仅可以发现规则随时间变化的情况,也能够预测规则的发展趋势.本文还提出了两个挖掘动态关联规则的算法,且对他们做了比较.并给出了柱状图和时间序列两种方法分析这两个向量.最后给出了一个挖掘动态关联规则的应用实例。  相似文献   

5.
最简关联规则及其挖掘算法   总被引:3,自引:0,他引:3       下载免费PDF全文
李杰  徐勇  王云峰  王友 《计算机工程》2007,33(13):46-48
传统关联规则挖掘算法往往产生过多规则而难以被决策者所采用。针对该问题,文章从应用的角度提出了最简关联规则,其特点是后项只包括一种产品,同时追求规则前项产品项数的最小化,在此基础上给出了一种最简关联规则挖掘算法。利用该算法得到的最简关联规则集包括的规则数量大为减少且能得出与全部关联规则集相同的决策,避免了大量的冗余挖掘,提高了挖掘效率和应用效果。  相似文献   

6.
针对传统挖掘算法生成的关联规则存在大量冗余、难于理解和应用的问题,提出一种新的频繁闭项集概念格FCIL(Frequent Closed Itemsets Lattices),用于生成无冗余关联规则。首先,对概念格理论进行研究,概念格节点间的泛化和例化关系非常适合规则提取;然后,结合频繁闭项集能有效减少规则数目的特点,构建一种新的FCIL;最后,给出FCIL构造算法和相应的规则提取算法。实验表明,该方法能够高效地产生无冗余规则集。  相似文献   

7.
一种无冗余的快速关联规则发现算法   总被引:4,自引:0,他引:4  
吴伟平  林馥  贺贵明 《计算机工程》2003,29(8):90-91,108
关联规则的发现是数据挖掘的一个重要方面。传统算法不但涉及大量的数据库操作,而且生成的关联规则之间存在着大量的冗余规则。文章给出了一种无冗余的快速关联规则算法,能大量减少所需的I/O的次数,内存开销适中,并且利用规则之间的冗系关系消除了规则之间的冗余性。  相似文献   

8.
本文根据关联规则和分类规则的概念与表示形式,指出在关联规则挖掘过程中如果指定挖掘与一个确定的项相关联,那么就是分类规则挖掘了,论述了分类规则是特殊情况下的关联规则,并指出在这种特殊情况下,关联规则所具有的特征;然后根据这一论述,提出了一种在关联规则挖掘算法中利用限制条件概率分布来发现分类规则的算法。  相似文献   

9.
胡和平  刘冰 《计算机工程》2000,26(12):97-98,172
量化关联规则的挖掘是数据挖掘的一项重要任务。该文介绍了一种高效的算法,用于挖掘特定形式的量化关联规则。该算法不仅效率高而且很好地解决了区间分隔引起的规则冗余等一系列问题。最后对能够挖掘的规则形式进行了扩展。  相似文献   

10.
概念格上无冗余关联规则的提取算法NARG   总被引:2,自引:0,他引:2       下载免费PDF全文
在数据挖掘中,关联规则是很有价值的一类规律。普通的挖掘算法会产生大量的规则,尤其是当最小支持度和最小可信度减少时,关联规则的数目急剧上升。如何对规则进行约减而又不丢失数据信息是消除冗余关联规则的关键。根据概念格的理论和冗余关联规则的性质,提出在概念格上提取无冗余关联规则的NARG算法。该算法可以得到最小的无冗余的关联规则集,而且不丢失任何信息,可有效提高关联规则生成的效率。  相似文献   

11.
快速多层次关联规则的挖掘   总被引:10,自引:0,他引:10  
程继华  施鹏飞 《计算机学报》1998,21(11):1037-1041
知识发现是指对原始数据进行分析,提取出隐含的,有用的规则,是当前快速发展的研究领域,是知识获取的重要方法,关联规则是知识发现的重要研究内容之一,本文提出了一种新的多层次关联规则挖掘算法ML_AR,算法ML_AR在挖掘过程中,只对最低概括层次上的候选系模式进行模式的匹配计算,求解出简化的频繁式集合,最后再求解各个概括层次上的繁频模式集合,算法ML_AR有效地利用了概括的层次关系,减少了模式的匹配计算  相似文献   

12.
加权关联规则的开采   总被引:24,自引:0,他引:24  
关联规则可以揭示数据之间隐含的关系,并已在许多领域取得了广泛的应用。目前已经提出了许多有效发现关联规则的算法,这些算法都认为每个数据对规则的重要性相同。但在实际应用中,用户更关心近期发生的数据,即历史越久远的数据对规则的影响应该小,应当削弱这些数据对规则的影响,为此,本文提出了垂直加权关联规则的问题;另外,用户有时可能希望加强或削弱某些项目对规则的影响,即所谓的水平加权关联规则。最后,提出了混合加权关联规则的问题,并给出了一个解决该问题的算法MWAL,实验证明了MWAL算法的有效性。  相似文献   

13.
关联规则挖掘可以从大量数据中发现项集间潜在而有趣的相互联系。针对用户对每个项目感兴趣的程度不同,一些学者提出了水平加权关联规则。然而每次生成新候选集后对整个数据库事物的扫描成为算法效率的一大瓶颈。为进一步提高加权关联规则的挖掘效率,在原有的水平加权关联规则算法的基础上,采取了深度优先的策略,提出了一种基于BUC的水平加权关联规则挖掘算法——BUc—MINWAL。改进算法可以大大减少对数据库的扫描范围。实验结果表明,改进的算法有更好的执行效率。  相似文献   

14.
线性关联规则研究   总被引:1,自引:0,他引:1  
首先讨论了布尔型关联规则的不足,然后提出了线性关联规则的概念,详细讨论了线性关联规则的挖掘方法,具体给出了线性关联规则的挖掘过程,分析了线性关联规则的作用。还给出了实验结果,并将线性关联规则和布尔型关联规则及定量关联规则进行了比较。  相似文献   

15.
数据库中关联规则信息是知识的表述形式之一,负关联规则挖掘是数据库关联信息挖掘的重要研究内容,具有广泛的应用范围。现有的挖掘方法不能获取数据库中全部的负关联规则,考虑从数据库中提取全部的负关联规则,通过(1)扫描数据库建立数据库频繁模式树DFP-tree(Database Frequent Pattern tree);(2)在精简DFP-tree的基础上获取全部极小非频繁项集ASI;(3)对ASI中极大频繁项集的向上闭包,得到全部非频繁项集;(4)在此基础上采用相关度作为规则兴趣度量之一提取负关联规则。理论和实验表明算法的正确性和效率。  相似文献   

16.
传统关联规则挖掘是在整个事务数据库的时间范围内进行的,但有时用户想得到某一特定时间范围(如商品的促销阶段)内的关联规则,该文对这一问题进行了详细讨论,提出了基于定制时间的时态支持度、时态频繁项集、时态置信度、时态关联规则等概念,在传统Apriori算法的基础上提出了挖掘时态频繁项集的算法。另一方面,讨论了当同时考虑正、负关联规则出现的矛盾规则问题以及用相关性解决这一问题的方法,提出了挖掘正负时态关联规则的算法,实例说明了算法的执行过程及有效性。  相似文献   

17.
在由频繁项集产生关联规则时,利用提升度判断规则前、后件之间的正相关性可以避免产生一些无意义的关联。但是,这并不能保证规则前、后件中的项是正相关的,也不能减少挖掘频繁项集的时间开销。当规则的前件或后件存在负相关的项时,仍然可能产生无意义的关联规则。针对以上问题,基于数学期望,提出了正相关的频繁项集的概念,并改进了一种直接在FP-树中挖掘频繁项集的算法,挖掘出正相关的频繁项集,从而有效地解决以上问题。实验表明,该算法可以大幅度地减少所产生的频繁项集数量,显著地降低了挖掘频繁项集的时间开销。对于大型数据集,尤其是稠密型数据集,该算法具有良好的性能。  相似文献   

18.
不可约关联规则及其应用   总被引:3,自引:0,他引:3  
在大型数据库项目之间发现关联规则是一个重要的数据挖掘问题,而挖掘出的关联规则数常常是巨大的,本文主要考虑不可约关联规则,不可约关联规则数通常比全部规则数少,讨论利用不可约关联规则可导出其它关联规则,并给出其算法。  相似文献   

19.
基于频繁模式树的负关联规则挖掘算法   总被引:1,自引:0,他引:1       下载免费PDF全文
典型的正关联规则仅考虑事务中所列举的项目。负关联规则不但要考虑事务中所包含的项目集,还必需考虑事务中所不包含的项目,它包含了非常有价值的信息。然而,对于负关联规则的研究却很少,仅有的几种算法也存在一定的局限性。为此,该文提出了一种基于FP-tree的负关联规则挖掘算法,该算法不但可以发现事务数据库中所有的负关联规则,而且整个过程只需扫描事务数据库两次,算法是有效和可行的。  相似文献   

20.
兴趣度--关联规则的又一个阈值   总被引:54,自引:3,他引:51  
关联规则的采掘是数据采掘研究的一个重要方面,分析现有的关联规则采掘算法中所存在的问题:首先是关联规则在其表达形式上没有考虑各种可能的反面示例的影响,因而导致知识表达功能的不够完善;其次是有可能一条规则即使可信度和支持度都很高,仍没有实际意义,甚至是误导性的,因此对关联规则的形式定义作了修改,将运用差异思想引兴起度阈值运用到关联规则中来,并给出其形式定义,在分析了兴趣度的实际意义以后,讨论了举度与概  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号