首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
针对粗糙集理论中传统的基于正域的属性约简算法和基于信息熵的属性约简算法无法得到最小约简集的问题,给出基于信息熵改进的属性约简算法,即先使用条件熵识别出重要度值最大的属性,使用正域进行约简判断。在此基础上,设计了高效的基于MapReduce的信息熵改进属性约简算法。以真实海量气象数据为基础,在Hadoop集群上实现上述算法,验证了该算法的有效性和效率。  相似文献   

2.
基于相容矩阵的改进属性约简算法   总被引:1,自引:0,他引:1       下载免费PDF全文
原属性约简算法在计算相容关系时,存在大量重复计算,从而导致时间复杂度为O(|C|3|U|2)。针对该问题,基于不完备决策表,提出时间复杂度为O(|U|2)的高效相容矩阵计算算法,在此基础上,设计改进的基于相容矩阵的属性约简算法。通过实例证明,当空间复杂度相同时,改进算法的时间复杂度从原有O(|C|3|U|2)降为O(|C|2|U|2)。  相似文献   

3.
在粗糙集理论中,知识约简已经成为其核心内容之一。针对相关文献中基于相容矩阵的不完备信息系统属性约简算法,提出了一种新的相容矩阵定义,该矩阵能够减少关注的条件属性。同时,也证明利用该矩阵所求的属性约简与相关文献中的属性约简是等价的。给出了其属性约简算法,提高了属性约简的速度。  相似文献   

4.
属性约简自寻优算法   总被引:25,自引:1,他引:24  
属性约简是知识获取中的关键问题之一。为了能够较为有效地获得较优的属性约简,首先在粗糙集理论的基础上构造出了相对差异比较表,然后把它与启发性知识相结合分别设计出了3个算法:属性约简的改进算法(AR1),属性约简判定的完备算法(RJ)和属性约简的改进增强算法(AR2);接着,将这些算法作为子算法并吸收了基因算法的基本思想和模拟退火算法的具体操作,设计出了属性约简自寻优算法(ADSOA);最后,将该算法应用于中医类风湿关节炎诊断决策表的约简。实验结果表明,属性约简自寻优算法能够以较大的概率和较高的效率获得较优的属性约简,对于某些具体问题来说甚至能够获得最佳的属性约简;这也同时表明相对差异比较表的提出对于进一步构造效率更高的属性约简算法具有较大的实际意义。  相似文献   

5.
从一种扩展的信息观的角度出发,讨论了Rough集理论的信息论观点。提出了一种基于扩展的信息熵的决策表核属性计算算法.并设计了以属性重要性为启发信息的自下而上的决策表属性约简算法EIEAAR。同时针对不一致表,将属性对不相客对象的包含值作为第二标准选择属性以加快约简速度。EIEAAR算法能处理一致和不一致决策表,并将核属性计算和非核属性约简统一起来。最后,对算法进行复杂度分析并用实例验证算法的有效性。实验表明该算法能有效得到决策表的最小约简。  相似文献   

6.
一种基于粗糙集的决策系统属性约简算法   总被引:28,自引:1,他引:28  
从大量数据发现知识时,属性约简是一个关键问题,本文提出了一种新的算法用于粗集中的属性约简,该算法基于Hu的差别矩阵,在对差别矩阵进行化简的基础上,先得到核,然后在逐步减小的差别矩阵中挑选出最频繁的属性加入直到成为一个约简。文中还对求核的正确性,算法的正确性进行了证明,同时对算法复杂度进行了分析,最后给出了一个例子来说明算法的有效性。  相似文献   

7.
粗糙集和信息熵的属性约简算法及其应用   总被引:2,自引:0,他引:2  
吴尚智  苟平章 《计算机工程》2011,37(7):56-58,61
阐述粗糙集理论和信息熵的基本概念,并为寻找属性约简的有效方法,提出一种基于粗糙集和信息熵的属性约简算法。在决策表中添加某个属性引起的互信息变化的大小,以反映该属性的重要性,并求相对约简。研究表明,该算法不仅能得到最优的决策规则,而且能够减少信息系统所需的搜索空间,得到更优的属性约简效果。  相似文献   

8.
粗糙集中找到最小属性约简是一个NP-hard问题,本文根据知识信息熵的定义和性质,定义属性重要性,分析其性质,得出核的求法,给出约简的判定定理,提出了一种基于信息熵的属性约简算法。该算法采用启发式搜索法,先计算属性重要性,求得核,再以核为起点,以属性重要性大小为启发式信息,选择属性,求得最小约简。理论分析和实际计算表明,该算法简明有效。  相似文献   

9.
基于属性重要性的属性约简算法   总被引:2,自引:0,他引:2  
粗糙集理论是一个新的处理不确定性问题的数学工具,属性约简是粗糙集理论的核心问题之一。为了获得决策系统中更好的相对属性约简,提出一种基于属性重要性的属性约简算法。将可辨识矩阵中出现次数多少作为属性重要性的判断依据。算法还考虑了当出现次数相同的情况下属性选择问题,由此定义新的属性重要性,以新的属性重要性为启发信息,分析表明,提出的算法是有效可行的。  相似文献   

10.
侯丽珊  苗夺谦 《计算机科学》2002,29(12):127-128
1 引言粗糙集理论自1982年由波兰科学家Z.Pawlak提出发展到现在,知识约简已经成为其研究的核心内容之一。知识约简包括属性约简和属性值约简,属性约简是对整个知识库而言的,在保证信息量不减少的前提下,去掉冗余的属性;而属性值的约简是针对每条信息(决策)的描述而言的,在不影响对其分类或决策的能力的情况下,不考虑某些属性的取值。本文所提到的约简如果没有特别说明,特指属性的约简。一般来讲,约简是不唯一的,人们当然希望能够找到具有最少属性的约简,即最小约简。遗憾的是,求解最小约简是NP完全问题,任何非穷举的算法都不能保证所得结果是最优的,这时不得  相似文献   

11.
指出现有粗糙集属性约简算法的不足,考虑并行遗传算法在处理大型数据库上的特有优势,将粗糙熵作为粗糙集不确定性的度量,给出一种求解信息系统约简集的三群体并行遗传算法.最后通过实例计算表明该算法能快速有效求解属性约简,而且对大规模数据样本的信息系统效果更为明显.  相似文献   

12.
基于信息熵的一种属性约简算法   总被引:2,自引:3,他引:2  
文章针对Rough Set理论的核心内容之一属性约简进行了研究。结合信息论的有关知识,研究了在属性约简过程中决策属性集相对条件属性集的条件熵的变化规律,在此基础上提出了新的属性约简算法。实验分析表明,在多数情况下这种算法都能够得到决策表的最小约简,同时还对算法复杂度做了简单的分析。  相似文献   

13.
毛军军  李侠  吴涛 《计算机工程》2011,37(15):125-127
针对传统粗集理论中属性赋权不一致,甚至相悖的问题,把2个概率分布的相对熵扩展到任意2个单维向量的相对熵,并将相对熵视作一种距离。通过定义属性重要度的代数观和粒度观确定优化权重的取值范围,根据各方案的属性值尽可能靠近理想值、远离负理想值的原理,建立单目标赋权优化模型。针对等价关系的局限性,将优势关系引入属性权重确定方法中。基于优势关系的序信息系统,将代数观下和粒度观下的权重通过相对熵优化模型进行耦合,得到多属性决策中属性权重的优化解。算例分析结果证明了该模型的有效性。  相似文献   

14.
一种粗糙集属性约简算法   总被引:15,自引:5,他引:15  
该文针对RoughSet理论的属性约简进行了研究。利用RoughSet和信息论的相关知识,研究了通过可辨识矩阵求得属性约简集,并利用条件熵来计算属性约简集中属性间的相关性,其平均值最小的属性集即为求得的最佳属性约简的结果。实验证明,它可以取得比较理想的效果。最后利用该文的方法给出了对UCI机器学习数据库的例子的约简结果。  相似文献   

15.
基于粗糙集理论的属性约简算法的VB实现   总被引:1,自引:0,他引:1  
粗糙集理论成为近年来数据挖掘领域的研究热点,基于粗糙集理论的属性约简算法具有重要的研究意义,开发一套用于研究粗糙集理论属性约简算法的软件将是有效的辅助工具。论文首先对粗糙集理论基本概念及属性约简问题进行介绍,接着介绍该软件的设计和结构功能,举例说明该软件的应用,并提出该软件有待进一步扩展的功能。  相似文献   

16.
基于遗传算法的粗糙集属性约简算法   总被引:20,自引:0,他引:20  
属性约简是粗糙集理论中的一个核心问题,为了有效获取属性最小相对约简,本文提出了一种基于遗传算法的粗糙集属性约简算法.该算法将核引入遗传算法的初始群体来提高算法的性能,依照决策属性对条件属性的依赖度,在加强局部搜索能力的同时保持了该算法全局寻优的特性,能够获得最佳的搜索效果.实验结果证明了该算法能够快速有效的进行属性约简。  相似文献   

17.
基于粗糙集理论的一种属性约简算法   总被引:4,自引:1,他引:4  
MIBARK算法在度量属性的重要性时计算量很大,它需要多次计算不同条件属性组合与决策属性之间的互信息。论文的改进算法以属性的频率作为选择属性的启发信息,由过滤差别矩阵得到属性的频率。实验表明,在获得相同属性约简的前提下,该算法与MIBARK算法相比,属性约简的计算量较少,提高了计算速度。  相似文献   

18.
实域粗糙集理论及属性约简   总被引:15,自引:1,他引:14  
肖迪  胡寿松 《自动化学报》2007,33(3):253-258
本文引入属性和属性子集广义重要度的概念以及空间中的广义近邻关系,提出广义近邻关系下的实域粗糙集扩展模型. 在实域粗糙集理论中,利用广义近邻关系在全局中划分相容模块,构成集合的下、上近似,避免了Pawlak粗糙集必须量化数据的麻烦. 另外,本文给出了实域粗糙集的属性约简定义和一种贪心算法,分析了约简属性集合的质量. 最后,通过实例验证了本文理论和方法的正确性和有效性.  相似文献   

19.
介绍了属性约简的原理,在此基础上提出了基于重要性的约简方法,它是利用属性重要性原理,求取核属性和最简属性约简。并举例与传统的方法进行比较。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号