共查询到20条相似文献,搜索用时 140 毫秒
1.
2.
粗糙集中找到最小属性约简是一个NP-hard问题,本文根据知识信息熵的定义和性质,定义属性重要性,分析其性质,得出核的求法,给出约简的判定定理,提出了一种基于信息熵的属性约简算法。该算法采用启发式搜索法,先计算属性重要性,求得核,再以核为起点,以属性重要性大小为启发式信息,选择属性,求得最小约简。理论分析和实际计算表明,该算法简明有效。 相似文献
3.
4.
一种基于知识粒度的不完备信息系统的属性约简算法 总被引:3,自引:1,他引:3
在不完备信息系统中,通过引入知识粒度的概念,对属性的重要性进行了定义,并以属性重要性为启发式信息,提出一种基于知识粒度的属性约简启发式算法,该算法的时间复杂度是多项式的,最后通过例子说明,该算法能得到不完备信息系统的一个约简。 相似文献
5.
一种实值属性信息系统的粗集约简方法 总被引:2,自引:0,他引:2
本文研究应用粗集理论对实值信息系统属性进行约简的方法,对实值属性信息系统进行约简的根本问题是如何对实值属性离散化,通过对离散化方法与属性约简的关系进行研究,提出实值属性离散化的一种自动确定属性类别的方法,并结合粗集理论给出了对实值属性信息系统约简的算法,用所提出的算法进行了实验,并给出了实验结果。 相似文献
6.
属性约简是粗糙集理论中最重要的研究内容之一。在决策粗糙集中,学者提出了多种属性约简的定义,其中包括保持所有对象正决策不变的约简定义。针对该约简定义,为了高效地获取约简集,设计了一种启发式函数 ——决策重要度,这种启发式函数根据每个属性正决策对象集合的大小来定义其重要性,正决策对象集合越大表示重要性越高,由此构造了基于决策重要度的启发式属性约简算法。该算法的优点是通过对属性决策重要度的排序,确定了一个搜索方向,避免了属性的组合计算,减少了计算量,能够找出一个较小的约简集。实验结果表明,该算法是有效的,能够得到较好的约简效果。 相似文献
7.
8.
一种基于粗糙集属性频度约简算法的改进 总被引:1,自引:1,他引:0
为了获得有效的属性最小相对约简,在基于属性频度的启发式约简算法的基础上,提出了一种同时满足属性重要性和频度改进的启发式约简算法.该算法的基本思想是:以属性的核为基础,以频度作为选择属性的启发信息,即把属性频度最大的属性添加到核属性中,这样就把分类能力较强的属性添加到约简集合中,从而能够获得较优的约简. 相似文献
9.
为了获得决策系统中更好的相对属性约简,本文提出了一种基于差别矩阵的启发式属性约简算法。该算法以求差别矩阵为基础,不仅考虑了所选择条件属性与决策属性的互信 息,还考虑了其取值的分布情况,从信息论角度定义了一种新的属性重要性度量方法,将其作为启发式信息,最终求得属性约简集。实例表明,算法能够有效地对决策系统进进行约简,获得比较理想的约简结果,同时约简后的决策规则数目较少。 相似文献
10.
采用属性的重要性作为启发式属性约简规则比较普遍。选择几种研究较多的属性重要性启发式规则,如属性依赖度、区分矩阵频率、信息熵等,进行简要介绍。通过编程实现规则和算法、采用经典数据集的运算比较作了汇总,从运算结果分析中获取了不同启发式规则对属性约简影响的几个基本结论。 相似文献
11.
利用覆盖算法对数据进行处理,得到论域U的一个划分,定义一种基于覆盖的条件信息熵,由新的条件信息熵定义新的属性重要性,并证明了对于一致决策表,它与代数定义下的重要性是等价的。以新的属性重要性为启发信息设计约简算法,并给出计算新的条件信息熵的算法。实验结果表明该约简算法能快速搜索到最优或次优约简。 相似文献
12.
13.
基于粗集可辨识矩阵的属性约简算法 总被引:3,自引:0,他引:3
论文主要对RoughSet理论中的属性约简问题进行了研究。从Skowron可辨识矩阵出发,通过对属性重要性及属性间依赖性的讨论,利用条件熵构造了一种一致数据属性约简的启发式算法;通过实例和UCI数据库证明了该算法的有效性;并对文献犤4犦中的错误进行了修正。 相似文献
14.
通过分析目前信息观下不完备信息系统属性约简,针对已提出的几种信息熵存在随着属性的增加系统分类能力减弱的不足,从条件属性确定的容差类在决策属性划分上的分布出发,给出不完备决策表的条件分布信息量的定义;同时,定义了新的属性重要度,并以此为启发信息设计属性约简算法。通过实验说明了该算法对不完备决策表属性约简是可行的。 相似文献
15.
分析了传统属性频率函数作为属性重要度的不足,重新定义了属性重要度,提出了一种基于差别矩阵属性重要度的属性约简完备算法,即CRABSA(Complete Reduction Algorithm Based on the Significance of Attribute)。该算法采用迭代思想,在每次迭代过程中根据属性重要度SGF(a)选择必要的条件属性加入约简R中。由SGF(a)的定义可知,算法能确保在大多数情况下能得到决策表的最小约简。分析了算法在最坏情况下的时间复杂度,给出了该算法相对Pawlak约简的完备性的证明。 相似文献
16.
17.
18.
主要对Rough Set理论中的属性约简问题进行了研究,从寻找属性约简的两个角度出发,利用文献[5]中不可分辩类的定义及属性重要性的讨论,通过定义子集可辨识矩阵Ms(i,j)构造了一种广义核的启发式算法,并通过Delphi程序验证了该算法对实例和UCI数据库的有效性。 相似文献
19.
20.
一种基于属性重要性的启发式约简算法 总被引:2,自引:0,他引:2
属性约简是知识发现中的关键问题之一.为了能够有效地获取决策表中条件属性集的最小相对约简,本文首先利用代数方法描述决策表中的属性的重要性,提出了限制正域的概念,得到了关于限制正域的若干结果,并据此提出一种改进的属性约简算法,即以属性核为起点并结合算子,通过向属性核不断添加重要程度最大的属性,并利用已求得的正区域和限制正域使处理数据的范围不断缩小从而减少求约简的时间. 该算法能够节省得到决策表的最小约简的时间并能得到所有相对约简.实例分析也验证了该算法的有效性. 相似文献