首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 140 毫秒
1.
针对启发式约简算法难以获得最小约简的问题,研究属性之间的排斥与吸引等关联特性,给出属性重要度计算指数。在此基础上,结合属性频率方法,提出基于属性关联的启发式约简算法。该算法以最小约简为目标,采取兼顾单个属性的辨识能力以及属性之间关联的约简策略。实验结果表明,该算法比属性频率方法以及一些同类算法具有更少的属性启发次数,计算结果大部分为最小约简。  相似文献   

2.
一种新的用于连续值属性离散化的约简算法   总被引:4,自引:0,他引:4  
针对在Nguyen和Skowron的离散化算法中进行启发式约简时会出现某些属性不能进行离散化问题,以及在无核数据集中启发式约简算法计算量比较大等问题,在粗糙集理论和属性频率函数的基础上给出一个新概念-候选核,并提出一种新的用于连续值属性离散化的约简算法-基于候选核的启发式约简算法(简称BCC)。该算法可以寻找到能对所有属性进行离散化的约简,实验表明,所提出的BCC算法能提高大数据集的离散化效果。  相似文献   

3.
在基于正域的不一致决策表属性约简算法中,计算正域的算法效率是关键,直接影响到属性约简算法的时间复杂度。针对这一问题,新算法改进了区分矩阵的构造过程,提出了一种有效的在二进制区分矩阵上计算负域的方法,将约简的关键转换为对负域的计算,以属性频率为启发式信息指导属性约简过程。该算法也适用于一致决策表的属性约简。最后,通过实例证明了算法的有效性。  相似文献   

4.
属性约简是粗糙集理论中最重要的研究内容之一。在决策粗糙集中,学者提出了多种属性约简的定义,其中包括保持所有对象正决策不变的约简定义。针对该约简定义,为了高效地获取约简集,设计了一种启发式函数 ——决策重要度,这种启发式函数根据每个属性正决策对象集合的大小来定义其重要性,正决策对象集合越大表示重要性越高,由此构造了基于决策重要度的启发式属性约简算法。该算法的优点是通过对属性决策重要度的排序,确定了一个搜索方向,避免了属性的组合计算,减少了计算量,能够找出一个较小的约简集。实验结果表明,该算法是有效的,能够得到较好的约简效果。  相似文献   

5.
属性约简是一种重要的数据挖掘方法。为了对混合型信息系统达到更好的属性约简性能,提出一种邻域组合度量的启发式属性约简算法。邻域依赖度是构造混合信息系统属性约简的常用方法,根据粒计算的视角,在混合信息系统中提出邻域知识粒度用于评估属性的粒化能力。将邻域依赖度与邻域知识粒度进行结合,提出混合信息系统下的邻域组合度量,并将该度量方法作为启发式函数,提出一种属性约简算法。实验分析表明,该算法比混合信息系统的其他相关属性约简算法具有更高的约简性能。  相似文献   

6.
一种改进的基于二进制可分辨矩阵属性约简算法   总被引:1,自引:1,他引:0  
指出支天云的二进制可分辨矩阵约简算法存在的不足,给出简化的决策表定义和基于二进制可分辨矩阵的属性频率函数的定义.在此基础上,以核属性为初始约简集,以属性频率为启发式信息,提出了一种改进的基于二进制可分辨矩阵的属性约简算法,其最终可以获得一个最优约简,并且算法时间复杂度和空间复杂度分别为max{O(|C||U|),O(|C|2|U'|2)}和O(|C||U'|2).通过实例验证,表明该算法是有效的.  相似文献   

7.
一种改进的基于二进制可分辨矩阵属性约简算法   总被引:1,自引:0,他引:1  
指出支天云的二进制可分辨矩阵约简算法存在的不足,给出简化的决策表定义和基于二进制可分辨矩阵的属性频率函数的定义。在此基础上,以核属性为初始约简集,以属性频率为启发式信息,提出了一种改进的基于二进制可分辨矩阵的属性约简算法,其最终可以获得一个最优约简,并且算法时间复杂度和空间复杂度分别为max{O(|C| |U|),O(|C|^2| |U|^2)}和0(|C| |U|^2)。通过实例验证,表明该算法是有效的。  相似文献   

8.
粗糙集中找到最小属性约简是一个NP-hard问题,本文根据知识信息熵的定义和性质,定义属性重要性,分析其性质,得出核的求法,给出约简的判定定理,提出了一种基于信息熵的属性约简算法。该算法采用启发式搜索法,先计算属性重要性,求得核,再以核为起点,以属性重要性大小为启发式信息,选择属性,求得最小约简。理论分析和实际计算表明,该算法简明有效。  相似文献   

9.
分析HORAFA算法和HORAFA-A算法的不足,给出一种获得最优约简的启发式算法.算法以核属性为初始约简集,以属性频率为启发式信息,选择必要的属性加入约简集.该算法不仅适用于相容决策表系统,也适用于不相容决策表系统;同时,改进了反向消除方法,可以更快速地删除多余条件属性.实验表明,该算法是正确的,并且效率优于HORAFA-A算法.  相似文献   

10.
启发式算法在求解约简的过程中逐步加入重要度最高的属性,但其忽视了数据扰动将会直接引起重要度计算的波动问题,从而造成约简结果的不稳定。鉴于此,提出了一种基于集成属性重要度的启发式算法框架。首先,在原始数据上进行多重采样;然后,在每次循环过程中分别计算各个采样结果上的属性重要度并对这些重要度进行集成;最后,将集成重要度最大的属性加入到约简中去。利用邻域粗糙集方法进行的实验结果表明,基于集成重要度的属性约简算法不仅能够获取更加稳定的约简,而且利用所生成的约简能够得到一致性较高的分类结果。  相似文献   

11.
求解决策表的最小约简已被证明是NP-hard问题,在粗糙集和证据理论的基础上提出了一种知识约简的启发式算法。利用粗糙集等价划分的概念给出属性的信息熵,定义每个属性的熵值重要性并由此确定知识的核。引入二分mass函数对每个属性建立一个证据函数,证据融合得到每个属性的证据重要性。以核为起点,以证据重要性为启发,依次加入属性直至满足约简条件。实例表明,该方法能够快速找到核和相对约简,并且该约简运用到分类上正确率也是较高的。  相似文献   

12.
为了获得决策表中更好的属性约简,提出一种信息增益引导的蜂群优化算法;该算法以属性的信息熵为基础构造条件属性与决策属性间的互信息,用待选条件属性引起的信息增益作为引导蜜蜂搜索的启发信息,最终求得属性约简集;对UCI数据库多个数据集的测试结果表明,与其它基于群智能的属性约简算法相比,该算法获得最小属性约简的机率提高到90%以上,同时较对比算法的计算时间少耗费至少10%。  相似文献   

13.
提出了一种处理海量的不完备决策表的方法。将基于互信息的属性重要度作为启发式信息,利用遗传算法对不完备的原始决策表中的条件属性进行约简,形成包含missing值的决策表,称为优化决策表。利用原始决策表自身的信息,通过属性扩展,从优化决策表中抽取一致性决策规则,而无须计算missing值。该方法在UCI的8个数据集上的实验结果优于EMAV方法,是一种有效的从海量不完备决策表中抽取规则的方法。  相似文献   

14.
一种改进的变论域属性约简算法   总被引:2,自引:0,他引:2       下载免费PDF全文
本文主要对Rough Set理论中的属性约简问题进行了研究,从变论域的角度出发,利用可辨识矩阵对不可分辩类进行了定义,结合属性重要性及属性间依赖性的讨论,构造了一种变论域的启发式算法,并通过实例和UCI数据库证明了该算法的有效性。  相似文献   

15.
现有的很多属性约简算法都是由构造决策表的差别矩阵出发,将矩阵中非空元素的合取范式转化为极小析取范式。为提高对大规模数据的决策表进行约简的效率,文中指出基于U/{a}划分的最小约简算法存在的缺陷,给出以划分粒度为启发式信息,利用单个条件属性把论域划分成多个等价类,将计算整个全域上的属性约简问题转化为计算在相应划分的子区域上属性约简问题,提出了一种基于决策表分解的最小属性约简算法。理论分析和实例表明该约简算法是有效的。  相似文献   

16.
粗糙集属性约简方法及其在医疗中的应用研究   总被引:1,自引:1,他引:0       下载免费PDF全文
针对基于可辨识矩阵核求取属性约简存在的空间与时间都不理想的问题,提出一种新的基于粗糙集的属性约简启发式算法。该方法不直接构造及存储可辨识矩阵,而且在核不存在的情况下,也能取得较好的起点核心集,将获取矩阵元素及得到核心元素同步进行,并加入了对属性集频率的综合考虑。同时,将此方法应用于医疗诊断决策,并对属性约简前后的决策性能进行了分析。实验结果表明,利用约简后的属性集,计算复杂性降低,同时保持高的决策准确率,算法是有效的。  相似文献   

17.
不相容决策表的属性约简算法   总被引:1,自引:0,他引:1       下载免费PDF全文
对Skowron可辨识矩阵方法进行分析,并应用反例说明基于Skowron可辨识矩阵的属性约简算法对不相容决策表的属性约简,可能会导致错误的结果。针对这一问题,提出了一种基于改进可辨识矩阵的属性频率约简算法。该算法以改进的可辨识矩阵为基础,以属性频率作为启发信息,同时在算法中加入消除冗余属性二次约简过程。提供了实例分析,验证了该算法能够有效地对相容与不相容的决策表进行属性约简。  相似文献   

18.
近年来,诸多学者喜欢用差别矩阵的方法来设计属性约简的算法,但由于计算差别矩阵不仅费时且还浪费空间,导致这些属性约简算法都不够理想。为了降低属性约简算法的复杂度,在布尔冲突矩阵的基础上,定义了一个启发函数,该函数能求出决策表中条件属性导致的冲突个数,同时给出了计算该启发函数的快速算法。然后用该启发函数设计了一个有效的基于改进的布尔冲突矩阵的不完备决策表的高效属性约简算法,该算法能够有效降低时间复杂度。最后实验结果说明了新算法的有效性。  相似文献   

19.
属性约简是粗糙集理论研究中的核心内容之一,现已证明寻找最小约简是NP-hard问题。该文对信息系统中属性的条件区分能力给出定义。在此基础上,提出了一种基于条件区分能力的属性约简的启发式算法。通过实例分析表明,在多数情况下该算法能够得到信息系统的最小约简。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号