首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 68 毫秒
1.
属性约简是粗糙集理论中最重要的研究内容之一。在决策粗糙集中,学者提出了多种属性约简的定义,其中包括保持所有对象正决策不变的约简定义。针对该约简定义,为了高效地获取约简集,设计了一种启发式函数 ——决策重要度,这种启发式函数根据每个属性正决策对象集合的大小来定义其重要性,正决策对象集合越大表示重要性越高,由此构造了基于决策重要度的启发式属性约简算法。该算法的优点是通过对属性决策重要度的排序,确定了一个搜索方向,避免了属性的组合计算,减少了计算量,能够找出一个较小的约简集。实验结果表明,该算法是有效的,能够得到较好的约简效果。  相似文献   

2.
一种基于粗糙集的决策系统属性约简算法   总被引:28,自引:1,他引:28  
从大量数据发现知识时,属性约简是一个关键问题,本文提出了一种新的算法用于粗集中的属性约简,该算法基于Hu的差别矩阵,在对差别矩阵进行化简的基础上,先得到核,然后在逐步减小的差别矩阵中挑选出最频繁的属性加入直到成为一个约简。文中还对求核的正确性,算法的正确性进行了证明,同时对算法复杂度进行了分析,最后给出了一个例子来说明算法的有效性。  相似文献   

3.
针对粗糙集理论中传统的基于正域的属性约简算法和基于信息熵的属性约简算法无法得到最小约简集的问题,给出基于信息熵改进的属性约简算法,即先使用条件熵识别出重要度值最大的属性,使用正域进行约简判断。在此基础上,设计了高效的基于MapReduce的信息熵改进属性约简算法。以真实海量气象数据为基础,在Hadoop集群上实现上述算法,验证了该算法的有效性和效率。  相似文献   

4.
粗糙集中找到最小属性约简是一个NP-hard问题,本文根据知识信息熵的定义和性质,定义属性重要性,分析其性质,得出核的求法,给出约简的判定定理,提出了一种基于信息熵的属性约简算法。该算法采用启发式搜索法,先计算属性重要性,求得核,再以核为起点,以属性重要性大小为启发式信息,选择属性,求得最小约简。理论分析和实际计算表明,该算法简明有效。  相似文献   

5.
粗糙集理论是一个新的处理不确定性问题的数学工具,属性约简是粗糙集理论的核心问题之一。但求解最优约简已被证明是一个NP—hard问题。基于属性重要度的启发式算法在属性约简中应用的较多.文中分别介绍了基于区分矩阵、基于相关矩阵和基于信息量的属性约简算法。对其思想进行了剖析和总结。  相似文献   

6.
属性约简是粗糙集理论的重要研究内容之一。在Pawlak粗糙集模型中,正区域大小随着属性增多而变大,呈现单调性。然而,在决策粗糙集模型中,概率正区域与属性集之间不具有单调性,从而产生各种属性约简定义。为此,深入研究了决策粗糙集属性约简问题,阐述了几种约简定义之间的关系,证明了保持局部最大概率正区域的约简具有较大的代价,指出了保持所有对象的正决策不变的约简呈现稳定性和存在属性核。  相似文献   

7.
粗糙集和信息熵的属性约简算法及其应用   总被引:2,自引:0,他引:2  
吴尚智  苟平章 《计算机工程》2011,37(7):56-58,61
阐述粗糙集理论和信息熵的基本概念,并为寻找属性约简的有效方法,提出一种基于粗糙集和信息熵的属性约简算法。在决策表中添加某个属性引起的互信息变化的大小,以反映该属性的重要性,并求相对约简。研究表明,该算法不仅能得到最优的决策规则,而且能够减少信息系统所需的搜索空间,得到更优的属性约简效果。  相似文献   

8.
基于粗糙集的决策规则约简   总被引:4,自引:1,他引:4  
粗糙集理论是一个新的数据挖掘方法,正越来越被人们所重视。其主要思想是保持分类能力不变的情况下,利用等价类,通过属性约简和决策规则约简,达到发掘知识并简化知识的目的。但是属性约简是一个NP问题,对属性的约简和决策规则的约简只能通过启发式算法实现。该文针对属性约简和决策规则约简,各提出了一个启发式算法。  相似文献   

9.
一种粗糙集值约简算法及其应用   总被引:6,自引:0,他引:6  
对已有的粗糙集约简算法进行了研究,分析了这些算法中存在的问题。提出一种粗糙集值约简算法。该算法重点不在于求得最佳属性约简,而在于求得满足用户需求的最佳值约简。通过实例介绍了该算法的应用。算法能实现粗糙集的值约简,并能计算出各规则的支持度。  相似文献   

10.
作为Pawlak粗糙集的扩展,邻域粗糙集能有效地处理数值型的数据。但是,因为沿用了Pawlak粗糙集在构造上下近似集时的包含关系,邻域粗糙集对噪声数据的容错性很差。针对这个问题,本文通过引入贝叶斯最小风险决策规则,提出了一种基于容错改进的邻域粗糙集属性算法。通过和现有的算法进行比较,实验结果表明,在数据预处理阶段用该算法能得到更好的属性约简。  相似文献   

11.
基于信息熵的一种属性约简算法   总被引:2,自引:3,他引:2  
文章针对Rough Set理论的核心内容之一属性约简进行了研究。结合信息论的有关知识,研究了在属性约简过程中决策属性集相对条件属性集的条件熵的变化规律,在此基础上提出了新的属性约简算法。实验分析表明,在多数情况下这种算法都能够得到决策表的最小约简,同时还对算法复杂度做了简单的分析。  相似文献   

12.
刘芳  李天瑞 《计算机科学》2016,43(12):63-70
介绍了基于概率粗糙集模型的启发式属性约简算法,提出了概率粗糙集模型中的概率近似精度和改进概率近似精度的增量更新机制,通过比较概率近似精度的更新值得到属性核,然后通过比较改进概率近似精度的值逐步得到概率粗糙集中的属性约简。最后提出了一种概率粗糙集模型中属性核与属性约简的加速求解算法,并举例说明了所提算法的有效性和可行性。  相似文献   

13.
刘偲  秦亮曦 《计算机科学》2016,43(Z11):67-72
针对决策中普遍存在的代价问题,在模糊理论和决策粗糙集的基础上,对其代价敏感属性约简方法进行了研究。在模糊决策粗糙集属性约简中引入了包含误分类代价和测试代价的总代价。因此约简的目标不再只是考虑正域的大小,而是寻找使得总代价最小的最优属性子集。提出了一种模糊决策粗糙集代价敏感属性约简(COSAR)算法,该算法采用启发式方法搜索最优属性子集。给出了算法的步骤,并将该算法与已有的模糊粗决策粗糙集属性快速约简(QuickReduct)算法进行了性能对比。实验结果表明,COSAR算法比QuickReduct算法具有更强的属性约简能力、更低的分类总代价、更短的运行时间,且随着测试样本的增加,分类总代价差值也越来越大。  相似文献   

14.
基于模糊粗糙集的传统约简算法的时间代价较高,在处理大规模数据时耗时过长,且在许多实际大规模数据集上存在有限时间内无法收敛等问题。因此将权重引入属性约简的定义中,其中属性权重是属性重要度的数值指标。通过构建优化问题来求解属性权重,证明了属性依赖度即是属性权重的最优解。因此,提出了基于属性权重排序的约简算法,从而大大提升了约简的速度,使得约简算法可以应用于大规模数据集,特别是高维数据集中。  相似文献   

15.
纪滨 《微机发展》2008,(6):73-75
随着对粗糙集理论研究的的深入,基于信息论的信息熵陆续被引入到粗糙集研究中,陆续产生了一些如条件熵、联合熵、知识熵、决策熵、知识粗糙熵、粗集粗糙熵等新的概念,尽管丰富了粗糙集理论和应用,但使用中存在语义不统一的地方,甚至缺乏必要的说明和证明。对这些有价值的新概念作了系统的、严格的、规范的定义及阐述,给出了它们的公式表示,同时,通过相关熵的运算揭示彼此间的关系,最后指出这些熵的应用范畴,以便研究人员在清楚概念的基础上作进一步研究。  相似文献   

16.
基于广义粗集覆盖约简的粗糙熵   总被引:13,自引:0,他引:13  
黄兵  何新  周献中 《软件学报》2004,15(2):215-220
在广义粗集覆盖约简理论中,由于集合的上下近似是由其覆盖约简来确定的,因此有必要寻求一种新的度量来刻画知识和粗集的粗糙性.通过引入信息熵以刻画广义粗集覆盖约简的知识粗糙性以及粗集粗糙性,提出了一种新的知识粗糙性和粗集粗糙性度量.得到知识粗糙熵和粗糙集的粗糙熵都随广义覆盖约简的变细而单调减少的结论,从信息论观点出发,对不完备信息系统粗集理论进行了探讨.  相似文献   

17.
粗集结合决策树的一种数据挖掘算法   总被引:1,自引:0,他引:1  
决策树是一种重要的数据挖掘方法,本文将决策树的基本建树思想ID3算法与对象决策属性化简的粗集理论相结合,得到一种新型的决策树建树方法。通过实例证明了该方法的效率有所提高,使挖掘的效果更简单、更容易理解。  相似文献   

18.
In rough set theory with every decision rule two conditional probabilities, called certainty and coverage factors, are associated. These two factors are closely related with the lower and the upper approximation of a set, basic notions of rough set theory. It is shown that these two factors satisfy the Bayes' rule.
The Bayes' rule in our case simply shows some relationship in the data, without referring to prior and posterior probabilities intrinsically associated with Bayesian inference. This relationship can be used to "invert" decision rules, i.e., to find reasons (explanation) for decisions thus providing inductive as well as deductive inference in our scheme.  相似文献   

19.
粗糙集的划分贴近度及基于划分贴近度的属性约简算法   总被引:1,自引:0,他引:1  
Rough集理论是近年来发展起来的一种处理不确定、不精确、不完整数据的数学工具.属性约简是粗糙集的核心内容之一.本文提出了一个新的不确定性度量一划分贴近度,并基于划分贴近度分别提出了对一般信息系统和决策信息系统进行属性约简的算法,对决策信息系统进行约简的算法不仅可以对一致决策表进行约简,还可以对不一致决策表进行有效的约简.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号