首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 218 毫秒
1.
基于相对约简格的关联规则研究   总被引:2,自引:0,他引:2  
研究了相对约简格中的概念与关联规则中的频繁项目集的内在联系,给出了利用相对约简格提取关联规则的方法和相应算法。  相似文献   

2.
一种新的多值属性关联规则挖掘算法   总被引:1,自引:0,他引:1       下载免费PDF全文
为解决多值属性的关联规则挖掘问题给出相似属性集合矩阵的概念,提出一种新的多值关联规则挖掘算法——Qarmasm算法。该算法无须扩展事务属性,约简效率高,能够直接生成候选频繁项集,求出其支持度,有效地发现频繁项。给出算法的描述及其复杂性分析。与经典算法的对比表明,该算法具有明显的优势。  相似文献   

3.
作为KDD应用领域重要组成部分的关联规则发现面临着生成过多冗余规则的问题,并成为制约其挖掘效率的主要因素之一;作为一种新的表示数据和知识的有效工具,频繁量化约简格因其是基于支持度筛选而仅保留量化相对约简格中的频繁概念和空概念及其关系的更为简化的扩展概念格结构,所以更加适用于从大规模数据库中进行非冗余规则的发现.提出了一种基于频繁量化约简格的非冗余关联规则发现算法,并进行了相应的发现过程的研究.  相似文献   

4.
基于规模约简和多支持度的关联规则挖掘   总被引:1,自引:0,他引:1  
史原  鲁汉榕  罗菁  高婷 《计算机工程与设计》2006,27(21):4105-4107,4114
关联规则挖掘的经典算法是Apriori算法,但是存在两大突出的问题,即多次扫描事务数据库和使用单一的支持度,导致了由于事务数据库的规模而增加搜索时间和产生冗余规则或有效规则被丢弃。以往的改进算法只从其中一方面进行考虑。因此同时考虑存在问题,给出了一种基于规模约简和多支持度的关联规则挖掘算法。分析和试验显示在效率上有提高。  相似文献   

5.
基于概念格挖掘GIS中的关联规则   总被引:1,自引:0,他引:1  
陈湘  吴跃 《计算机应用》2011,31(3):686-689
挖掘隐藏在地理信息系统(GIS)的空间数据中的知识是GIS研究领域和数据挖掘领域的重要方向。概念格是关联分析的重要技术之一。为了提高关联规则的挖掘速度,提出了一种基于增量式算法的概念格构造算法,通过用比较概念外延的方法建格,同时在建格过程中引入支持度约束,使得概念格的建格速度得到提高,并使建成的格具有高度的约简性,让后续的规则挖掘变得更容易。将所提算法应用于GIS的空间数据挖掘,取得了切实可行的应用结果。  相似文献   

6.
区间概念格理论是在区间参数基础上提出的一种新的对象挖掘方法,它能够更精确地处理不确定信息。区间参数[[α,β]]决定了区间概念和格结构,并对区间关联规则产生影响。针对区间参数对关联规则的控制和优化问题,首先提出了基于参数变化的区间概念格结构更新算法,随着区间参数等步长变化,对初始格结构进行更新;然后在此基础上进一步挖掘各区间参数下的关联规则,发现区间参数和关联规则之间的复杂联系,给出了规则库优化算法,该算法通过调整参数达到控制和优化规则的目的;最后对决策形式背景进行规则提取并验证了区间参数对关联规则的具体影响。  相似文献   

7.
一种高效的多层和概化关联规则挖掘方法   总被引:4,自引:1,他引:3  
毛宇星  陈彤兵  施伯乐 《软件学报》2011,22(12):2965-2980
通过对分类数据的深入研究,提出了一种高效的多层关联规则挖掘方法:首先,根据分类数据所在的领域知识构建基于领域知识的项相关性模型DICM(domain knowledge-based item correlation model),并通过该模型对分类数据的项进行层次聚类;然后,基于项的聚类结果对事务数据库进行约简划分;最后,将约简划分后的事务数据库映射至一种压缩的AFOPT树形结构,并通过遍历AFOPT树替代原事务数据库来挖掘频繁项集.由于缩小了事务数据库规模,并采用了压缩的AFOPT结构,所提出的方法有效地节省了算法的I/O时间,极大地提升了多层关联规则的挖掘效率.基于该方法,给出了一种自顶向下的多层关联规则挖掘算法TD-CBP-MLARM和一种自底向上的多层关联规则挖掘算法BU-CBP-MLARM.此外,还将该挖掘方法成功扩展至概化关联规则挖掘领域,提出了一种高效的概化关联规则挖掘算法CBP-GARM.通过大量人工随机生成数据的实验证明,所提出的多层和概化关联规则挖掘算法不仅可以确保频繁项集挖掘结果的正确性和完整性,还比现有同类最新算法具有更好的挖掘效率和扩展性.  相似文献   

8.
关联约简由Dominik首次提出,其采用粗糙集理论属性约简思想,从全局属性依赖的角度,挖掘出信息系统中所隐含的关联规则。由于求取给定信息系统所有关联约简和最优关联约简已被证明为NP-难问题,针对特定属性(事务)给出了两类关联约简构造性算法:Multi-Single算法和Single-Multi算法,从而挖掘出针对特定事务的关联规则,有益于综合评价各事务在信息系统中的作用。实例分析表明了所提算法的有效性。  相似文献   

9.
基于概念格的关联规则挖掘   总被引:2,自引:0,他引:2  
关联规则的挖掘是知识发现领域重要的研究方向之一,因此开展这方面的研究是很有意义的。论文给出了一种基于概念格的关联规则的算法,该算法首先通过约化形式背景,然后通过给定的阈值在约简的背景上建格,最后在格上提取符合条件的关联规则。例子说明了该算法的可行性和有效性。  相似文献   

10.
一种基于关联规则挖掘的粗糙集约简算法   总被引:6,自引:1,他引:6  
针对粗糙集理论中的约简这个重要问题进行了研究,引入关联规则挖掘中的支持度和置信度概念,提出一种基于关联规则挖掘算法思想的约简算法,从而得到更有效的约简。  相似文献   

11.
关联规则挖掘能使你们发现大量数据中项目集之间有趣的关联或相关关系,通过研究发现,用传统关联规则方法会生成大量包含重复意义的规则,这必然会对用户迅速做出决策产生干扰。该文提出了一种基于邻接格的规则集压缩方法,使生成的规则大大精化,从而提供给用户简洁紧凑的关联规则集。  相似文献   

12.
时序波动关联规则概念格并行挖掘的一个新算法   总被引:1,自引:0,他引:1  
基于概念格理论,研究了对时间序列的波动情况进行周期关联规则的挖掘.首先对时间序列进行了反季节化预处理,然后提出了生成周期关联规则的新并行算法,在算法内部对生成的概念进行了剪枝处理,有效地提高了挖掘速度.随后用所给出的高精度模型对不满足移动平均法反季节化预处理条件的时间序列进行了反季节化计算.实验证明了该方法的有效性.  相似文献   

13.
梁凯强  陆菊康 《计算机工程与设计》2007,28(13):3033-3035,3229
关联规则是数据挖掘中的核心任务之一,近年来国内外对关联规则算法的改进取得了比较大的成果.概念格是由二元关系导出的形式化工具.体现了概念内涵和外延的统一,非常适合于发现数据中的潜在关系,因此关联规则的提取也是概念格的一个主要的应用领域,极大的提高了关联规则的挖掘效率,然而由于缺乏领域知识的指导,所挖掘出的规则有些是无意义的或无法满足用户的需要,所以在规则的提取中需要引入领域知识,而领域本体是领域知识的清晰而结构化的表示,因此提出了应用领域本体对生成的概念格进行调整,从而实现对规则提取的指导,以发掘出高层关联规则以及多层次间的关联规则,以满足用户的需要.  相似文献   

14.
孟军  王蓬  张静  王秀坤 《计算机科学》2013,40(1):183-186,217
传统关联规则挖掘可能会得到大量的、杂乱的规则,它们对用户来说是不相关的或不感兴趣的。提出最小关联规则集和项集强依赖关系的概念,以实现基于项集依赖的最小关联规则挖掘算法。其不仅可以避免验证某一频繁项集下的所有非空真子集是否可形成关联规则,还可以通过删除那些过于复杂、有重复信息的规则来进一步简化传统规则集合。通过最小关联规则集可推导得到大多数冗余规则的支持度和置信度,实现了传统规则集的一种近似无损表述。采用UCI机器学习库中数据集进行实验,结果表明提出的方法得到的规则数量明显减少,且规则更加简短、无重复信息,为最小关联规则挖掘提供了更好的方法。  相似文献   

15.
概念格上无冗余关联规则的提取算法NARG   总被引:2,自引:0,他引:2       下载免费PDF全文
在数据挖掘中,关联规则是很有价值的一类规律。普通的挖掘算法会产生大量的规则,尤其是当最小支持度和最小可信度减少时,关联规则的数目急剧上升。如何对规则进行约减而又不丢失数据信息是消除冗余关联规则的关键。根据概念格的理论和冗余关联规则的性质,提出在概念格上提取无冗余关联规则的NARG算法。该算法可以得到最小的无冗余的关联规则集,而且不丢失任何信息,可有效提高关联规则生成的效率。  相似文献   

16.
数据挖掘中传统的关联规则生成算法产生的关联规则集合相当庞大,其中很多规则可由其它规则导出。使用闭项集可以减少规则的数目,而概念格节点间的泛化和例化关系非常适用于规则的提取。目前几种基于概念格的规则提取算法局限于得到准确支持度、信任度的无冗余规则。提出了一种在概念格上挖掘出能推导出所有满足最小支持度、信任度规则的规则产生集算法,文中称之为组规则产生集算法,减少了规则的规模。在此基础上进一步给出了组规则产生集的存储数据结构并用其导出一般规则产生集的算法。  相似文献   

17.
关联规则的冗余删除与聚类   总被引:9,自引:0,他引:9  
关联规则挖掘常常会产生大量的规则,这使得用户分析和利用这些规则变得十分困难,尤其是数据库中属性高度相关时,问题更为突出.为了帮助用户做探索式分析,可以采用各种技术来有效地减少规则数量,如约束性关联规则挖掘、对规则进行聚类或泛化等技术.本文提出一种关联规则冗余删除算法ADRR和一种关联规则聚类算法ACAR.根据集合具有的性质,证明在挖掘到的关联规则中存在大量可以删除的冗余规则,从而提出了算法ADRR;算法ACAR采用一种新的用项目间的相关性来定义规则间距离的方法,结合DBSCAN算法的思想对关联规则进行聚类.最后将本文提出的算法加以实现,实验结果表明该算法暑有数可行的.且具较高的效率。  相似文献   

18.
用传统的规则生成算法产生的关联规则集合相当庞大,其中很多规则可由其它规则导出。使用闭项集可以减少规则的数目,而概念格节点间的泛化和例化关系非常适用于规则的提取。目前几种基于概念格的规则提取算法局限于得到准确支持度、信任度的无冗余规则。提出了一种在概念格上挖掘出能推导出所有满足最小支持度、信任度规则的规则产生集算法,文中称之为组规则产生集算法,减少了规则的规模,提高了挖掘效率,进一步给出了组规则产生集的存储数据结构和根据应用需要用其导出单一后项规则的算法。  相似文献   

19.
关联规则是数据挖掘中的概念,通过分析数据找到数据之间的关联.海量数据会产生大量冗余和相似的关联规则,影响用户对规则的理解和判断.本文采用鸢尾花数据集进行实验.建立三个检验指标,删除冗余关联规则;在进行K-means分析时利用规则产生的三角形迭代选择初始点,再将删除冗余后的规则进行聚类.实验证实本文方法将相似的关联规则归为一簇,能有效的帮助用户迅速找到有用的关联规则,有助于用户更好的对规则进行理解和分析,提高了聚类的效率.  相似文献   

20.
一种基于约简概念格的关联规则快速求解算法   总被引:4,自引:2,他引:2  
关联规则挖掘是数据挖掘领域中重要的研究分支,已形成了较多的研究成果。然而,大多数基于频繁项集求解关联规则的挖掘算法需要多次扫描数据库。该文提出了一种基于概念格的关联规则快速求解算法,该算法仅需一次扫描数据库即可确定所有的频繁项集并且进而能够快速求解出关联规则。文章首先讨论了约简概念格(RECL)的构造原理,并详细描述了基于RECL的关联规则的挖掘算法,最后以实验证明了算法的正确性和优越性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号