首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
一种新的用于连续值属性离散化的约简算法   总被引:4,自引:0,他引:4  
针对在Nguyen和Skowron的离散化算法中进行启发式约简时会出现某些属性不能进行离散化问题,以及在无核数据集中启发式约简算法计算量比较大等问题,在粗糙集理论和属性频率函数的基础上给出一个新概念-候选核,并提出一种新的用于连续值属性离散化的约简算法-基于候选核的启发式约简算法(简称BCC)。该算法可以寻找到能对所有属性进行离散化的约简,实验表明,所提出的BCC算法能提高大数据集的离散化效果。  相似文献   

2.
粗糙集中找到最小属性约简是一个NP-hard问题,本文根据知识信息熵的定义和性质,定义属性重要性,分析其性质,得出核的求法,给出约简的判定定理,提出了一种基于信息熵的属性约简算法。该算法采用启发式搜索法,先计算属性重要性,求得核,再以核为起点,以属性重要性大小为启发式信息,选择属性,求得最小约简。理论分析和实际计算表明,该算法简明有效。  相似文献   

3.
针对中医胸痹(即冠心病)诊断规则的获取,采用基于粗糙集理论的规则提取方法.首先进行连续属性的离散化,生成基于决策的知识表达系统.然后利用属性约简的改进算法对决策表进行属性约简,找出诊断结果的核属性,综合考虑属性对约简的增益和属性在剩余属性集中的重要性,给出了衡量属性重要性程度的一个准则.随后进行属性值约简,获取诊断规则.本算法并用VC++和SQL Server 2000实现.  相似文献   

4.
一种基于知识粒度的不完备信息系统的属性约简算法   总被引:3,自引:1,他引:3  
李秀红  史开泉 《计算机科学》2006,33(11):169-170
在不完备信息系统中,通过引入知识粒度的概念,对属性的重要性进行了定义,并以属性重要性为启发式信息,提出一种基于知识粒度的属性约简启发式算法,该算法的时间复杂度是多项式的,最后通过例子说明,该算法能得到不完备信息系统的一个约简。  相似文献   

5.
一种实值属性信息系统的粗集约简方法   总被引:2,自引:0,他引:2  
本文研究应用粗集理论对实值信息系统属性进行约简的方法,对实值属性信息系统进行约简的根本问题是如何对实值属性离散化,通过对离散化方法与属性约简的关系进行研究,提出实值属性离散化的一种自动确定属性类别的方法,并结合粗集理论给出了对实值属性信息系统约简的算法,用所提出的算法进行了实验,并给出了实验结果。  相似文献   

6.
属性约简是粗糙集理论中最重要的研究内容之一。在决策粗糙集中,学者提出了多种属性约简的定义,其中包括保持所有对象正决策不变的约简定义。针对该约简定义,为了高效地获取约简集,设计了一种启发式函数 ——决策重要度,这种启发式函数根据每个属性正决策对象集合的大小来定义其重要性,正决策对象集合越大表示重要性越高,由此构造了基于决策重要度的启发式属性约简算法。该算法的优点是通过对属性决策重要度的排序,确定了一个搜索方向,避免了属性的组合计算,减少了计算量,能够找出一个较小的约简集。实验结果表明,该算法是有效的,能够得到较好的约简效果。  相似文献   

7.
为了获得有效的属性最小相对约简,在基于属性频度的启发式约简算法的基础上,提出了一种同时满足属性重要性和频度改进的启发式约简算法。该算法的基本思想是:以属性的核为基础,以频度作为选择属性的启发信息,即把属性频度最大的属性添加到核属性中,这样就把分类能力较强的属性添加到约简集合中,从而能够获得较优的约简。  相似文献   

8.
一种基于粗糙集属性频度约简算法的改进   总被引:1,自引:1,他引:0  
为了获得有效的属性最小相对约简,在基于属性频度的启发式约简算法的基础上,提出了一种同时满足属性重要性和频度改进的启发式约简算法.该算法的基本思想是:以属性的核为基础,以频度作为选择属性的启发信息,即把属性频度最大的属性添加到核属性中,这样就把分类能力较强的属性添加到约简集合中,从而能够获得较优的约简.  相似文献   

9.
一种基于差别矩阵的启发式属性约简算法   总被引:2,自引:0,他引:2       下载免费PDF全文
为了获得决策系统中更好的相对属性约简,本文提出了一种基于差别矩阵的启发式属性约简算法。该算法以求差别矩阵为基础,不仅考虑了所选择条件属性与决策属性的互信 息,还考虑了其取值的分布情况,从信息论角度定义了一种新的属性重要性度量方法,将其作为启发式信息,最终求得属性约简集。实例表明,算法能够有效地对决策系统进进行约简,获得比较理想的约简结果,同时约简后的决策规则数目较少。  相似文献   

10.
采用属性的重要性作为启发式属性约简规则比较普遍。选择几种研究较多的属性重要性启发式规则,如属性依赖度、区分矩阵频率、信息熵等,进行简要介绍。通过编程实现规则和算法、采用经典数据集的运算比较作了汇总,从运算结果分析中获取了不同启发式规则对属性约简影响的几个基本结论。  相似文献   

11.
利用覆盖算法对数据进行处理,得到论域U的一个划分,定义一种基于覆盖的条件信息熵,由新的条件信息熵定义新的属性重要性,并证明了对于一致决策表,它与代数定义下的重要性是等价的。以新的属性重要性为启发信息设计约简算法,并给出计算新的条件信息熵的算法。实验结果表明该约简算法能快速搜索到最优或次优约简。  相似文献   

12.
翟俊海  万丽艳  王熙照 《计算机科学》2014,41(12):148-150,154
在经典粗糙集中,基于重要度的决策表属性约简算法只考虑了决策属性与条件属性之间的依赖度,没有考虑约简中条件属性之间的相关性,由此求出的约简中可能依然包含冗余属性。针对这一问题,提出了一种改进算法,它利用最小相关性和最大依赖度准则求决策表属性约简。与基于重要度的决策表属性约简算法相比,本算法求出的约简包含的属性个数少、冗余小。实验结果显示,本算法优于基于重要度的决策表属性约简算法。  相似文献   

13.
基于粗集可辨识矩阵的属性约简算法   总被引:3,自引:0,他引:3  
论文主要对RoughSet理论中的属性约简问题进行了研究。从Skowron可辨识矩阵出发,通过对属性重要性及属性间依赖性的讨论,利用条件熵构造了一种一致数据属性约简的启发式算法;通过实例和UCI数据库证明了该算法的有效性;并对文献犤4犦中的错误进行了修正。  相似文献   

14.
通过分析目前信息观下不完备信息系统属性约简,针对已提出的几种信息熵存在随着属性的增加系统分类能力减弱的不足,从条件属性确定的容差类在决策属性划分上的分布出发,给出不完备决策表的条件分布信息量的定义;同时,定义了新的属性重要度,并以此为启发信息设计属性约简算法。通过实验说明了该算法对不完备决策表属性约简是可行的。  相似文献   

15.
分析了传统属性频率函数作为属性重要度的不足,重新定义了属性重要度,提出了一种基于差别矩阵属性重要度的属性约简完备算法,即CRABSA(Complete Reduction Algorithm Based on the Significance of Attribute)。该算法采用迭代思想,在每次迭代过程中根据属性重要度SGF(a)选择必要的条件属性加入约简R中。由SGF(a)的定义可知,算法能确保在大多数情况下能得到决策表的最小约简。分析了算法在最坏情况下的时间复杂度,给出了该算法相对Pawlak约简的完备性的证明。  相似文献   

16.
建立粗糙集模型和SQL语言之间的关系,给出信息系统中基于SQL语言的属性集区分能力、对象集的上下近似、属性重要性、核、约简等概念,提出基于属性集区分能力的完备属性约简算法。实验结果表明了该算法的有效性,为粗糙集理论更广泛地应用于具体的实践提供了一种方法。  相似文献   

17.
一种具有记忆功能的遗传算法属性约简方法*   总被引:3,自引:3,他引:0  
通过对粗糙集属性约简算法现状的分析,针对遗传算法求取属性约简中存在的问题,提出一种基于具有记忆功能遗传算法粗糙集属性约简的新算法。该算法通过在编码过程引入一个标志位,使遗传算子具有一定的记忆功能,从而分别对两个子群进行搜索,同时只对其中一个子群采用最佳个体保存法,提高了收敛的概率,保证了最终结果的正确性。实验表明,该算法在收敛性和正确性方面优于基于传统遗传算法的属性约简算法。  相似文献   

18.
一种改进的属性约简算法及其Delphi实现   总被引:4,自引:1,他引:3       下载免费PDF全文
主要对Rough Set理论中的属性约简问题进行了研究,从寻找属性约简的两个角度出发,利用文献[5]中不可分辩类的定义及属性重要性的讨论,通过定义子集可辨识矩阵Ms(i,j)构造了一种广义核的启发式算法,并通过Delphi程序验证了该算法对实例和UCI数据库的有效性。  相似文献   

19.
本文以分类为基础提出了一种基于条件熵的决策表属性并行约简算法。该算法通过条件熵的计算在属性约简的同时将原决策表逐层分解为相对于决策属性来说尽量均匀的子决策表,从而实现了属性约简的并行计算。本文随后对该算法的时间复杂度进行了分析,实验表明,该算法在效率方面优于传统算法。  相似文献   

20.
一种基于属性重要性的启发式约简算法   总被引:2,自引:0,他引:2  
属性约简是知识发现中的关键问题之一.为了能够有效地获取决策表中条件属性集的最小相对约简,本文首先利用代数方法描述决策表中的属性的重要性,提出了限制正域的概念,得到了关于限制正域的若干结果,并据此提出一种改进的属性约简算法,即以属性核为起点并结合算子,通过向属性核不断添加重要程度最大的属性,并利用已求得的正区域和限制正域使处理数据的范围不断缩小从而减少求约简的时间. 该算法能够节省得到决策表的最小约简的时间并能得到所有相对约简.实例分析也验证了该算法的有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号