首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
在粗糙集不确定性度量公式中,模糊熵和模糊度是重要的度量方式。根据粗糙集不确定性度量中模糊熵和新的模糊度公式,提出了在决策信息系统中修正条件信息熵和相对模糊熵的概念,并分别用两种方式证明了熵在属性约简过程中的单调性。然后利用向前添加属性算法进行属性约简,约简结果在RIDAS(roughset based intelligent data analysis system)平台上进行识别率测试,通过实验对比分析了两种新的信息熵与条件信息熵的约简结果,为基于信息熵的属性约简提供了参考。  相似文献   

2.
基于变精度粗糙信息熵的特征约简算法   总被引:2,自引:0,他引:2  
为解决传统粗糙集不确定度量存在的局限,提出将变精度粗糙信患熵作为度量标准.该度量标准不仅具有变精度粗糙集良好的抗噪声干扰性能,而且具有基于信息理论的粗糙信息熵更全面反映系统不确定性的能力.给出了基于变精度粗糙信息熵的特征约简算法,实验结果表明该算法具有良好的运行效果.  相似文献   

3.
粗糙集中找到最小属性约简是一个NP-hard问题,本文根据知识信息熵的定义和性质,定义属性重要性,分析其性质,得出核的求法,给出约简的判定定理,提出了一种基于信息熵的属性约简算法。该算法采用启发式搜索法,先计算属性重要性,求得核,再以核为起点,以属性重要性大小为启发式信息,选择属性,求得最小约简。理论分析和实际计算表明,该算法简明有效。  相似文献   

4.
陈俞  赵素云  李雪峰  陈红  李翠平 《软件学报》2017,28(11):2825-2835
传统的属性约简由于其时间复杂度和空间复杂度过高,几乎无法应用到大规模的数据集中.将随机抽样引入传统的模糊粗糙集中,使得属性约简的效率大幅度提升.首先,在统计下近似的基础上提出一种统计属性约简的定义.这里的约简不是原有意义上的约简,而是保持基于统计下近似定义的统计辨识度不变的属性子集.然后,采用抽样的方法计算统计辨识度的样本估计值,基于此估计值可以对统计属性重要性进行排序,从而可以设计一种快速的适用于大规模数据的序约简算法.由于随机抽样集以及统计近似概念的引入,该算法从时间和空间上均降低了约简的计算复杂度,同时又保持了数据集中信息含量几乎不变.最后,数值实验将基于随机抽样的序约简算法和两种传统的属性约简算法从以下3个方面进行了对比:计算属性约简时间消耗、计算属性约简空间消耗、约简效果.对比实验验证了基于随机抽样的序约简算法在时间与空间上的优势.  相似文献   

5.
6.
基于信息熵的粗糙集属性约简及其应用   总被引:2,自引:0,他引:2       下载免费PDF全文
粗集约简对噪声非常敏感,因此寻求噪声干扰下,属性间的准确关系和不确定性关系的表达显得十分重要。将粗糙集理论与信息论理论结合起来,发挥各自优势,取长补短,提出了一种改进的属性约简算法,且在此基础上进行了值约简并应用于超大型船舶的旋回性分析。给出了各因素之间的依赖关系,增比特征,及规则分析。取得了很好效果,对船舶操纵和技术研究有良好的实用价值。  相似文献   

7.
基于模糊粗糙依赖度的连续值属性约简   总被引:1,自引:0,他引:1       下载免费PDF全文
针对传统的离散化技术所造成的信息丢失问题,提出了利用模糊粗糙集理论来进行属性约简的方法。描述了模糊等价关系下的粗糙集模型,定义了正域、依赖度等概念,提出了基于模糊粗糙依赖度的属性约简算法,该方法比传统属性约简方法具有更好的时间复杂性,并用实例证明了该算法的可行性。  相似文献   

8.
对具有连续属性值的信息系统的属性约简是粗糙集理论的研究热点之一。区别于传统通过连续属性离散化方法定义的等价关系,提出利用自适应的模糊C均值聚类的初步划分能力定义一种相似关系以及其自适应形式。基于该相似关系定义的粗糙集模型较好地排除噪声数据。提出正域与非正域定义以及从中导出的一种重要度以指导属性约简。与现有方法的比较实验表明该方法在属性约简上具有有效性和稳定性以及约简结果的合理性。  相似文献   

9.
属性约简是粗糙集理论的重要应用之一,其目的是在保持分类能力不变的前提下去掉冗余的属性,从而简化信息系统。由于经典粗糙集等价关系的要求过于严格,为了更好地解决实际问题,将粗糙集与二型模糊集结合,得到二型模糊粗糙集。利用论域和特征空间的积空间上的两个一型模糊集来构造论域的一个二型模糊划分,将模糊粗糙集属性约简的模型推广到二型模糊粗糙集框架中,得到了一个二型模糊粗糙属性约简的模型,并举例说明了用此模型进行属性约简的方法。  相似文献   

10.
信息熵是粗糙集理论中度量不确定信息的重要工具之一。蚁群优化算法是一种新型的智能计算的方法,具有分布式、正反馈及启发性搜索等优良的性质,并且在优化计算中已得到了很多应用.最小属性约简问题也是一类优化问题,已有的属性约简算法主要采用Pawlak正域度量属性的重要度,而且求最小约简是NP-hard问题.为此,在分析信息熵度量不确定性数据的基础上,定义信息熵属性重要度概念,引入蚁群优化算法,提出基于信息熵与蚁群优化的最小属性约简算法.该算法发挥蚁群优化算法良好的寻优能力,大多数情况下能够找到最小约简.理论分析与实验结果表明该算法是有效可行的.  相似文献   

11.
一种基于模糊理论和条件熵的属性近似约简的方法   总被引:3,自引:1,他引:2  
皋军  王建东 《计算机工程与应用》2004,40(21):182-184,212
给出了一种基于信息系统中连续型属性的模糊相似关系的定义以及相对应的关系矩阵,为了降低计算量对Warshall算法进行了改进。从信息论的角度提出了基于条件信息熵的属性新的近似相对约简集的概念和对应的约简算法,分析了算法的复杂度。实例和算法比较说明该算法是有效的。  相似文献   

12.
从一种扩展的信息观的角度出发,讨论了Rough集理论的信息论观点。提出了一种基于扩展的信息熵的决策表核属性计算算法.并设计了以属性重要性为启发信息的自下而上的决策表属性约简算法EIEAAR。同时针对不一致表,将属性对不相客对象的包含值作为第二标准选择属性以加快约简速度。EIEAAR算法能处理一致和不一致决策表,并将核属性计算和非核属性约简统一起来。最后,对算法进行复杂度分析并用实例验证算法的有效性。实验表明该算法能有效得到决策表的最小约简。  相似文献   

13.
一种面向连续属性空间的模糊粗糙约简   总被引:3,自引:1,他引:2  
简要叙述了模糊粗糙集理论中与属性约简相关的几个重要概念,研究了属性模糊化方法,并提出了一种结合遗传算法和模糊粗糙集理论的属性约简算法,它能快速找到完整地保留了原始数据集合的信息的一个属性约简.  相似文献   

14.
罗帆  蒋瑜 《计算机应用研究》2024,41(4):1047-1051
针对现有邻域粗糙集模型中存在属性权重都相同,无法保证关键属性在属性约简时能够被保留的问题,提出了一种基于信息熵加权的属性约简算法。首先,采用了类间熵、类内熵策略,以最大化类间熵最小化类内熵为原则给属性赋予权重;其次,构造了基于加权邻域关系的加权邻域粗糙集模型;最后,基于依赖关系评估属性子集的重要性,从而实现属性约简。在基于UCI数据集上与其他三种属性约简算法进行对比实验,结果表明,该算法能够有效去除冗余,提高分类精度。  相似文献   

15.
基于模糊粗糙集的传统约简算法的时间代价较高,在处理大规模数据时耗时过长,且在许多实际大规模数据集上存在有限时间内无法收敛等问题。因此将权重引入属性约简的定义中,其中属性权重是属性重要度的数值指标。通过构建优化问题来求解属性权重,证明了属性依赖度即是属性权重的最优解。因此,提出了基于属性权重排序的约简算法,从而大大提升了约简的速度,使得约简算法可以应用于大规模数据集,特别是高维数据集中。  相似文献   

16.
模糊粗糙集融合了模糊集和粗糙集的思想,是一种新的处理模糊和不确定性知识的软计算工具。针对属性为模糊值的信息系统,提出了一种基于熵的模糊粗糙集知识获取方法:首先通过模糊相似度量计算出各属性下对象的模糊相似值,再根据模糊相似关系构造模糊等价关系,然后根据模糊等价关系建立属性集的信息熵表示,继而使用基于信息熵的决策表属性约简算法获取规则。最后,通过一个实例,分析说明了这种算法的合理有效性。  相似文献   

17.
针对数据集为模糊值时冗余信息难于消除的问题,提出了基于模糊相似关系的广义模糊粗糙集与QuickReduct算法相结合的方法。利用广义模糊粗糙集数据相似程度对属性值为实数值的数据集合进行约简,不需要预先对原始数据集合进行离散化,约简结果能更完整地反映原信息系统的分类能力。同时算法中利用了启发式信息,使模糊依赖性增加较快的属性作为最小约简。计算实例验证了该方法的有效性。  相似文献   

18.
粗糙集和信息熵的属性约简算法及其应用   总被引:2,自引:0,他引:2  
吴尚智  苟平章 《计算机工程》2011,37(7):56-58,61
阐述粗糙集理论和信息熵的基本概念,并为寻找属性约简的有效方法,提出一种基于粗糙集和信息熵的属性约简算法。在决策表中添加某个属性引起的互信息变化的大小,以反映该属性的重要性,并求相对约简。研究表明,该算法不仅能得到最优的决策规则,而且能够减少信息系统所需的搜索空间,得到更优的属性约简效果。  相似文献   

19.
属性约简是粗糙集理论的重要研究分支,对信息系统进行属性约简有助于提高其数据的分类性能。针对医疗信息系统的多类型复杂数据环境,首先对多种数据类型分别提出了数据对象之间的模糊相似性度量;然后将这些度量方法进行整合,构造出医疗信息系统的一种新的模糊等价关系,并提出相应的模糊粗糙集模型;最后利用模糊粗糙依赖度,提出了医疗信息系统的一种属性约简算法。实验分析证明了所提出的算法具有更高的属性约简性能。  相似文献   

20.
针对大数据环境下数据冗余量大的问题,以粗糙集理论为基础,提出了一种基于香农信息熵(Shannon entropy)融合模糊综合评判的相似重复数据检测方法,首先基于香农熵对数据集中的属性进行约简,然后采用模糊综合评判方法获取约简后各属性的重要性权值,最后依据约简属性及其权值进行相似数据的检测。理论分析与实验对比表明,该方法在结构化大数据集的相似数据检测中,有较高的检测精度与效率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号