首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 171 毫秒
1.
数据挖掘中传统的关联规则生成算法产生的关联规则集合相当庞大,其中很多规则可由其它规则导出。使用闭项集可以减少规则的数目,而概念格节点间的泛化和例化关系非常适用于规则的提取。目前几种基于概念格的规则提取算法局限于得到准确支持度、信任度的无冗余规则。提出了一种在概念格上挖掘出能推导出所有满足最小支持度、信任度规则的规则产生集算法,文中称之为组规则产生集算法,减少了规则的规模。在此基础上进一步给出了组规则产生集的存储数据结构并用其导出一般规则产生集的算法。  相似文献   

2.
用传统的规则生成算法产生的关联规则集合相当庞大,其中很多规则可由其它规则导出。使用闭项集可以减少规则的数目,而概念格节点间的泛化和例化关系非常适用于规则的提取。目前几种基于概念格的规则提取算法局限于得到准确支持度、信任度的无冗余规则。提出了一种在概念格上挖掘出能推导出所有满足最小支持度、信任度规则的规则产生集算法,文中称之为组规则产生集算法,减少了规则的规模,提高了挖掘效率,进一步给出了组规则产生集的存储数据结构和根据应用需要用其导出单一后项规则的算法。  相似文献   

3.
针对传统挖掘算法生成的关联规则存在大量冗余、难于理解和应用的问题,提出一种新的频繁闭项集概念格FCIL(Frequent Closed Itemsets Lattices),用于生成无冗余关联规则。首先,对概念格理论进行研究,概念格节点间的泛化和例化关系非常适合规则提取;然后,结合频繁闭项集能有效减少规则数目的特点,构建一种新的FCIL;最后,给出FCIL构造算法和相应的规则提取算法。实验表明,该方法能够高效地产生无冗余规则集。  相似文献   

4.
基于概念格的关联规则挖掘方法   总被引:3,自引:0,他引:3  
对概念格在关联规则挖掘中的应用进行了研究.通过将概念格的外延和内涵分别与事务数据库中的事务和特征相对应,可以从概念格上产生频繁项集,进而挖掘关联规则.提出了一种基于概念格的关联规则挖掘方法,在背景中对象约简的基础上,构造出对象约简后的概念格,从新的概念格中先产生基本规则集,再根据用户给出的支持度阈值从基本规则集中挖掘出对用户有意义的规则,并给出了算法描述.该方法求出的关联规则和利用Apriori算法求出的结果是一致的.  相似文献   

5.
概念格是进行数据挖掘和规则提取的一种有效工具。目前已经提出的概念格上的规则提取方法大多是针对整个形式背景,得到的规则数目较多,规则集规模较大,且这种规则结构不便于两个规则集的合并。针对这个问题,本文提出一种伪规则的概念,并给出渐近式获取伪规则的方法;同时证明了通过伪规则集,用户可以根据自己的兴趣有选择地从伪规则集合中产生出所需的蕴含规则;提出了将两个伪规则集进行合并的方法,从而用户可以通过拆分合并的思想来获取规则集;最后通过实验分析验证了算法的有效性。  相似文献   

6.
王燕  李明 《计算机应用》2007,27(10):2376-2378
概念格是进行数据挖掘和规则提取的有力工具,通过分析概念格中概念的特征,提出了扩展概念格以及基于扩展概念格的分类规则获取算法。实验表明该算法能够生成简洁并且易于理解的规则集。  相似文献   

7.
基于趋势概念格的决策规则挖掘   总被引:1,自引:0,他引:1  
通过分析动态信息系统基于时间序列的对象变化特征,提出对象相关的趋势概念格概念,基于决策规则提取的目标,提出相应的建格算法和决策规则提取算法,并以股票走势预测为例,验证了算法的有效性。  相似文献   

8.
基于改进概念格的无冗余关联规则提取   总被引:1,自引:1,他引:0       下载免费PDF全文
在介绍概念格相关理论的基础上,提出改进概念格构造算法——Godin算法,在构造概念格的同时增加索引链表,有利于概念格的剪枝。把量化概念格、剪枝概念格与改进算法相结合,给出基于该改进算法的无冗余关联规则提取算法,并证明改进算法和无冗余规则提取算法的正确性和有效性。  相似文献   

9.
在形式概念分析中,提取关联规则是构造概念格的目的之一。量化规则格是为了便于提取规则的扩展概念格。概念格分布处理是先分布构造多个部分概念格,再合并构造出完整概念格,以提高构造格的速度。本文提出一种规则合并技术和相应的算法,由部分量化规则格提取部分关联规则,然后直接进行部分关联规则的合并,得到完整的关联规则,即对关联规则进行分布提取。由于无需构造完整格,并且直接再利用已有的部分关联规则,从而降低了利用概念格提取关联规则的复杂度。最后,给出一个简单的实例,说明算法的正确性,并通过实验验证了算法的有效性。  相似文献   

10.
概念格作为形式概念分析理论中的一种核心数据结构已经在众多的领域取得了广泛而成功的应用。从概念格上可以提取各种类型的知识,如蕴含规则、关联规则、分类规则等。利用概念格的所有节点的完备性特点,提出了一种基于概念格的新的决策规则挖掘算法,同时给出了规则的支持度。最后通过实例验证了算法的有效性。  相似文献   

11.
关联规则的快速提取算法   总被引:1,自引:0,他引:1  
针对基于频繁项集的关联规则挖掘算法效率低,需要多次扫描数据库且生成冗余候选项集问题,该文利用频繁项集的Aprior性质和概念格的基本思想提出一种关联规则提取算法,利用极大频繁项集来进行规则提取,去除了多数冗余的候选项集,提高了提取效率。  相似文献   

12.
给出一种挖掘最小蕴涵规则集的通用算法,该算法基于闭包运算,利用闭包运算产生所有闭集,从闭集格中导出最大∧-不可约集及其补集,然后产生最小蕴涵规则集;给出了计算所有闭集的新算法,同Ganter算法相比,该算法充分考虑闭包运算的特性,使得冗余计算显著减少,提高了算法效率.  相似文献   

13.
基于基集与概念格的关联规则挖掘算法   总被引:2,自引:0,他引:2       下载免费PDF全文
陈湘  吴跃 《计算机工程》2010,36(19):34-36
传统关联规则挖掘算法的挖掘效率较低,且挖掘结果中存在大量冗余。针对该问题,提出一种基于概念格与基集的关联规则挖掘算法。利用规定种子项分布范围的基集代替原始数据库以缩小挖掘源规模,从而建立概念格快速求解出关联规则。实验结果表明,该算法在时间效率方面优于Base和Apriori算法。  相似文献   

14.
许多研究表明概念格是数据分析与规则提取的一种有效工具.本文首先提出基于最大频繁项集幂集格上的规则提取算法.然后对此种算法进行改进,在已建好的概念格上直接从最大频繁项集进行规则提取,因而提高了挖掘关联规则的效率,适用于大型数据库中关联规则的挖掘.  相似文献   

15.
文本分类是信息检索与数据挖掘领域的研究热点与核心技术,近年来得到了广泛的关注和快速的发展。概念格是规则提取和数据分析的有效工具,然而概念格的构造效率始终是概念格应用的一大难题。本文研究了基于扩展概念格模型的文本分类规则提取,利用粗糙集和扩展概念格模型来进行分类规则提取。该方法利用概念树,极大地除去了冗余的概念,只需要建造很少的概念就能够提取出全部的分类规则,不仅效率较高,而且同时提取的分类规则与概念格相同。本文算法在MATLAB7.0的环境中运行的实验表明,查全率比KNN算法和SVM算法稍低,但是查准率比它们都高,因此该分类规则用于文本分类时效果与KNN和SVM相当。  相似文献   

16.
概念格上无冗余关联规则的提取算法NARG   总被引:2,自引:0,他引:2       下载免费PDF全文
在数据挖掘中,关联规则是很有价值的一类规律。普通的挖掘算法会产生大量的规则,尤其是当最小支持度和最小可信度减少时,关联规则的数目急剧上升。如何对规则进行约减而又不丢失数据信息是消除冗余关联规则的关键。根据概念格的理论和冗余关联规则的性质,提出在概念格上提取无冗余关联规则的NARG算法。该算法可以得到最小的无冗余的关联规则集,而且不丢失任何信息,可有效提高关联规则生成的效率。  相似文献   

17.
The incremental technique is a way to solve the issue of added-in data without re-implementing the original algorithm in a dynamic database. There are numerous studies of incremental rough set based approaches. However, these approaches are applied to traditional rough set based rule induction, which may generate redundant rules without focus, and they do not verify the classification of a decision table. In addition, these previous incremental approaches are not efficient in a large database. In this paper, an incremental rule-extraction algorithm based on the previous rule-extraction algorithm is proposed to resolve there aforementioned issues. Applying this algorithm, while a new object is added to an information system, it is unnecessary to re-compute rule sets from the very beginning. The proposed approach updates rule sets by partially modifying the original rule sets, which increases the efficiency. This is especially useful while extracting rules in a large database.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号