首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
基于Rough集理论的模糊值属性信息表简化方法   总被引:9,自引:0,他引:9  
为了有效地在信息表中处理取值为模糊术语的属性,解决Rough集对模糊值属性处理能力较弱的问题,提出了模糊不可分辨关系的概念,用于处理属性值为模糊术语的信息表.将约简、核、相对约简与相对核以及规则的约简与核等Rou曲集理论中一系列知识约简的概念推广到模糊环境下,提出了一种有效的模糊值信息表简化的启发式算法.数值实验验证该方法在模糊值属性信息表简化方面比传统的Pawlak方法和其他一些学者的相关工作更为有效.  相似文献   

2.
针对模糊聚类方法中存在冗余信息的问题,提出一种融合粗糙集属性约简和模糊等价关系的故障诊断方法,通过应用粗糙集属性约简算法对冗余数据的处理后再应用模糊等价关系聚类获取聚类结果。该方法与单采用模糊等价关系聚类法相比,不仅能够有效减少模糊等价关系矩阵求解中的迭代次数,而且获得聚类数也得到有效降低,并通过实例验证了该方法的有效性和高效性。  相似文献   

3.
属性约简能有效地去除不必要属性,提高分类器的性能。模糊粗糙集是处理不确定信息的重要范式,能有效地应用于属性约简。在模糊粗糙集中,样本分布的不确定性会影响对象的近似集,进而影响有效属性约简的获取。为有效地定义近似集,文中提出了基于距离比值尺度的模糊粗糙集,该模型引入了基于距离比值尺度的样本集的定义,通过对距离比值尺度的控制,避免了样本分布不确定性对近似集的影响;给出了该模型的基本性质,定义了新的依赖度函数,进而设计了属性约简算法;以SVM,NaiveBayes和J48作为测试分类器,在UCI数据集上评测所提算法的性能。实验结果表明,所提出的属性约简算法能够有效获取约简并提高分类的精度。  相似文献   

4.
粗糙集理论研究的核心内容之一是属性重要性的度量和属性约简。经典的粗糙集模型基于等价关系,适合于处理离散属性值。模糊粗糙集理论将模糊集和粗糙集理论结合起来,将等价关系扩展为模糊关系,可处理模糊属性值。分析了已有广泛运用的模糊决策表的属性约简算法FRAR存在的三个问题,提出了一种新的约简算法,较好地克服了原算法的问题,能处理规模较大的模糊决策表。  相似文献   

5.
基于模糊粗糙依赖度的连续值属性约简   总被引:1,自引:0,他引:1       下载免费PDF全文
针对传统的离散化技术所造成的信息丢失问题,提出了利用模糊粗糙集理论来进行属性约简的方法。描述了模糊等价关系下的粗糙集模型,定义了正域、依赖度等概念,提出了基于模糊粗糙依赖度的属性约简算法,该方法比传统属性约简方法具有更好的时间复杂性,并用实例证明了该算法的可行性。  相似文献   

6.
现实世界中常常包含着海量的、不完整的、模糊及不精确的数据或对象,使得模糊信息粒化成为近年来研究趋势。利用论域上的模糊等价关系定义了模糊粒度世界的模糊知识粒度,给出了新的属性约简条件和核属性计算方法,以便更好地挖掘出潜在的、有利用价值的信息。针对粗糙集在对连续属性约简的过程中容易造成信息缺失和不能对模糊属性处理的现象,提出了一种基于模糊知识粒度对混合决策系统约简的启发式算法,省去了连续属性离散化过程,减少了计算量,为离散值域和混合值域约简提供了统一的方法。最后通过实例验证了其有效性。  相似文献   

7.
属性约简是粗糙集理论的重要研究分支,对信息系统进行属性约简有助于提高其数据的分类性能。针对医疗信息系统的多类型复杂数据环境,首先对多种数据类型分别提出了数据对象之间的模糊相似性度量;然后将这些度量方法进行整合,构造出医疗信息系统的一种新的模糊等价关系,并提出相应的模糊粗糙集模型;最后利用模糊粗糙依赖度,提出了医疗信息系统的一种属性约简算法。实验分析证明了所提出的算法具有更高的属性约简性能。  相似文献   

8.
属性约简是机器学习等领域中常用的数据预处理方法。在基于粗糙集理论的属性约简算法中,大多是根据单一的方法来度量属性重要度。为了从多角度对属性达到更为优越的评估效果,首先在已有的模糊邻域粗糙集模型中定义属性依赖度度量,然后根据粒计算理论中知识粒度的概念,在模糊邻域粗糙集模型下提出了模糊邻域粒度度量。由于属性依赖度和知识粒度代表了不同视角的属性评估方法,因此将这两种方法结合起来用于信息系统的属性重要度评估,最后给出一种启发式属性约简算法。实验结果表明,所提出的算法具有较好的属性约简性能。  相似文献   

9.
基于邻域粗糙集以及模糊粗糙集等价关系下的属性约简方法,引入$\alpha $信息熵,建立模糊相似关系下的α信息熵不确定性度量,提出基于$\alpha $信息熵的属性重要度度量,并以此构建混合属性约简算法.利用UCI数据集与几种相关的约简方法进行比较,验证了该方法可以选择较少属性的同时保证较高的分类精确性.实际应用中,对参数α的有效调节,可获得多个约简结果,进而可根据需要选择最佳约简.  相似文献   

10.
在模糊决策表中,基于有序加权平均(Ordered weighted averaging,OWA)算子建立的相容关系中,OWA算子是一个信息集成工具。本文利用OWA算子及其诱导的截集相容关系,分别讨论基于正域、负域与边界域的属性约简。首先,利用OWA算子中的权重给出属性区分对象的贡献度;然后,根据属性贡献度定义每个属性被约简的可能性;从而给出模糊决策表的一种启发式三支属性约简方法,该方法可以减少属性约简的搜索空间并避免属性约简的盲目性;最后,利用实例来分析影响该三支区域属性约简方法的主要因素,并说明该启发式属性约简方法的合理性和有效性。本文提出的属性贡献度度量及启发式三支属性约简方法将减少属性约简的搜索空间,有益于模糊决策表特征选取的应用。  相似文献   

11.
由于可以从多粒度、多层次的角度对名词型和数值型属性并存的混合数据进行有效处理,邻域多粒度粗糙集模型受到了广泛关注.为了有效降低属性约简计算过程中的迭代次数,实现邻域多粒度粗糙集模型的快速属性约简算法,基于双重粒化准则,深入分析不同属性子集序列和邻域半径对正域的影响,结合正域在属性子集和邻域半径共同作用下的单调性,提出一种基于双重粒化准则的邻域多粒度粗集快速约简算法,并通过理论分析与实例对比验证了算法的有效性和优越性.  相似文献   

12.
李成  赵海琳 《测控技术》2018,37(11):50-54
属性约简是粗糙集理论在模式识别中一项重要的应用,传统的属性约简算法只适合处理静态的信息系统,而处理不断动态更新的信息系统面临着巨大的挑战。对于不完备信息系统,提出一种增量式的属性约简算法。在不完备信息系统下引入粗糙集理论中关于正区域的概念,针对不完备信息系统中属性增加的情形,提出了基于正区域的增量式属性约简算法。实验结果表明了所提出的增量式属性约简算法比非增量式的算法具有更高的效率,同时比其他同类型的算法具有更高的优越性。  相似文献   

13.
姚晟  汪杰  徐风  陈菊 《计算机应用》2018,38(1):97-103
针对现有的属性约简算法不适合处理数值型属性和符号型属性共同存在的不完备数据,提出了一种拓展不完备邻域粗糙集模型。首先,通过考虑属性值的概率分布来定义缺失属性值之间的距离,可以度量具有混合属性的不完备数据;其次,定义了邻域混合熵来评价属性约简的质量,分析证明了相关的性质定理,并构造了一种基于邻域混合熵的不完备邻域粗糙集属性约简算法;最后从UCI数据集中选取了7组数据进行实验,并分别与基于依赖度的属性约简(ARD)、基于邻域条件熵的属性约简(ARCE)、基于邻域组合测度的属性约简(ARNCM)算法进行了比较。理论分析和实验结果表明,所提算法约简属性比ARD、ARCE、ARNCM分别减少了约1,7,0个,所提算法的分类精度比ARD、ARCE、ARNCM分别提高了约2.5,2.1,0.8个百分点。所提算法不仅能够获得较少的约简属性,同时具有较高的分类精度。  相似文献   

14.
属性约减是粗糙集理论的重要研究内容之一。由于Z.Pawlak经典粗糙集模型在处理集合间隶属关系过于简单的缺陷,文章提出了以集合间距离作为集合隶属关系的判别依据,对属性依赖度和重要度重新进行了定义,从而对属性约减算法进行改进。最后,通过一个数据模型的验证,改进后的算法能够更有效地滤除冗余属性,保留关键属性。  相似文献   

15.
在粗糙集的核心方法属性约简理论中,针对次要属性过多时属性依赖度一致引发的约简困难现象,以粗糙集属性依赖度强化为基本方法构建数据挖掘模型。模型中,计算各属性在组合中的依赖度,将组合中的依赖度合并于各属性从而强化属性依赖度。为合理化计算过程,给出一种离散化方法并构建探索模型进行实验,缩小离散量范围与属性组合范围。最后所得依赖度作为属性重要性,挖掘重要属性。实验证明,在部分地区5级以上震后经济损失影响因素分析中,比较传统属性约简,该模型可更有效地分析属性之间的重要性,解决了约简困难的问题,使用测试数据时该模型与传统方法的结果有86%的一致性。  相似文献   

16.
康猛  蒙祖强 《计算机应用》2022,42(2):449-456
基于区分矩阵的传统属性约简方法具有直观易理解的优点,但时间和空间复杂度都很高,当数据规模较大或条件属性较多时,会无法快速得到约简结果.为解决该问题,在区分关系的基础上构造了条件区分能力来进行属性选择,提出一种基于条件区分能力的属性约简算法.而为了进一步加快属性重要性的计算、提高约简效率,依据大数定律中频率的稳定性,通过...  相似文献   

17.
一种基于属性重要性的启发式约简算法   总被引:2,自引:0,他引:2  
属性约简是知识发现中的关键问题之一.为了能够有效地获取决策表中条件属性集的最小相对约简,本文首先利用代数方法描述决策表中的属性的重要性,提出了限制正域的概念,得到了关于限制正域的若干结果,并据此提出一种改进的属性约简算法,即以属性核为起点并结合算子,通过向属性核不断添加重要程度最大的属性,并利用已求得的正区域和限制正域使处理数据的范围不断缩小从而减少求约简的时间. 该算法能够节省得到决策表的最小约简的时间并能得到所有相对约简.实例分析也验证了该算法的有效性.  相似文献   

18.
一种基于粗糙集的决策系统属性约简算法   总被引:28,自引:1,他引:28  
从大量数据发现知识时,属性约简是一个关键问题,本文提出了一种新的算法用于粗集中的属性约简,该算法基于Hu的差别矩阵,在对差别矩阵进行化简的基础上,先得到核,然后在逐步减小的差别矩阵中挑选出最频繁的属性加入直到成为一个约简。文中还对求核的正确性,算法的正确性进行了证明,同时对算法复杂度进行了分析,最后给出了一个例子来说明算法的有效性。  相似文献   

19.
颜家凯  范敏  刘文奇  叶荣荣 《微机发展》2014,(1):102-104,108
粗糙集理论是一种处理不确定性知识的有效工具,属性约简是其核心内容之一,然而对于属性值有缺省的不完备信息系统,基于等价关系的经典粗糙集理论已经不再适用。由于容差关系下的不完备信息系统的属性约简的定义与经典粗糙集的属性约简定义相似,可以用容差关系对粗糙集理论进行扩充。文中通过定义容差关系下的可辨识矩阵,运用可辨识方法,得到了一种属性约简算法;接着分析了算法的不足之处,并且在此基础上提出了增加约简效率的改进型算法;最后通过一个数值例子,说明了该算法是合理的和有效的。  相似文献   

20.
Rough set theory is a useful mathematic tool for dealing with vague and uncertain information. Shannon's entropy and its variants have been applied to measure uncertainty in rough set theory from the viewpoint of information theory. However, few studies have been carried out on information-theoretical measure of attribute importance in incomplete decision system (IDS) considering the relation between decision attribute and condition attributes. In this paper, we introduce the concept of conditional entropy together with entropy and joint entropy in IDSs. By using the new conditional entropy, we propose a measure for attribute importance. Based on the measure, a heuristic attribute reduction algorithm is presented. Some test experiments on real-lift data-sets show the effectiveness of the algorithm. The attribute importance measure and the attribute reduction algorithm can be used in data mining or machine learning for handling incomplete data.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号