共查询到19条相似文献,搜索用时 203 毫秒
1.
2.
属性约简是粗糙集理论一项重要的应用,目前已广泛运用于机器学习和数据挖掘等领域,邻域粗糙集是粗糙集理论中处理连续型数据的一种重要方法.针对目前邻域粗糙集模型中属性约简存在的缺陷,构造一种基于邻域粗糙集的邻域粗糙熵模型,并基于此给出邻域粗糙联合熵、邻域粗糙条件熵和邻域粗糙互信息熵等概念.邻域粗糙互信息熵是评估属性集相关性的一种重要的方法,具有非单调性变化的特性,对此,提出一种基于邻域粗糙互信息熵的非单调性属性约简算法.实验分析表明,所提出算法不仅比目前已有的单调性属性约简算法具有更优越的属性约简结果,而且具有更高的约简效率. 相似文献
3.
基于对称交叉熵的属性约简算法 总被引:1,自引:0,他引:1
针对交叉熵用来度量两个随机变量的差异程度时不满足对称性的问题,提出对称交叉熵的概念.研究在决策表的属性约简过程中决策属性集相对条件属性集对称交叉熵的变化规律,提出基于对称交叉熵的属性约简算法,同时还对其复杂度进行简单分析.实验分析表明,在多数情况下该算法能够得到决策表的最小相对约简. 相似文献
4.
5.
6.
一种基于粗糙熵的知识约简算法 总被引:8,自引:1,他引:7
李鸿 《计算机工程与应用》2005,41(14):78-80,148
描述了知识的粗糙性,提出了知识的粗糙熵概念,建立了信息系统中知识与粗糙熵之间的关系,并通过知识的粗糙熵对属性的重要性进行了定义。在此基础上,提出了基于粗糙熵的知识约简算法,该算法的时间复杂性为O(|R|3|U|2)。通过例子分析,表明该算法是有效的。 相似文献
7.
以分类为基础提出一种基于条件熵的决策表属性约简算法。通过条件熵的计算在属性约简的同时将原决策表逐层分解成相对于决策属性来说尽量均匀的子决策表,从而缩小了数据规模;随后对算法的时间复杂度进行了分析;实验表明,该算法在效率方面优于传统算法。 相似文献
8.
出于不同的应用目的,许多学者提出了各种不同的属性约简概念.给出相对熵保持不变的条件,利用相对熵定义了决策表的相对熵约简,证明相对熵约简与HU的差别矩阵和差别函数的约简方法是等价的. 相似文献
9.
10.
基于信息熵的一种属性约简算法 总被引:5,自引:3,他引:2
文章针对Rough Set理论的核心内容之一属性约简进行了研究。结合信息论的有关知识,研究了在属性约简过程中决策属性集相对条件属性集的条件熵的变化规律,在此基础上提出了新的属性约简算法。实验分析表明,在多数情况下这种算法都能够得到决策表的最小约简,同时还对算法复杂度做了简单的分析。 相似文献
11.
12.
互信息的序决策信息系统属性约简研究 总被引:1,自引:0,他引:1
王青海 《计算机工程与设计》2012,33(7):2822-2826
优势关系粗糙集理论是粗糙集理论有意义的推广,决策信息系统知识约简是粗糙集理论的核心内容之一.通过在协调序决策信息系统中引入条件熵、互信息概念,给出了基于条件熵、互信息的协调序决策信息系统属性约简算法,并通过学生评价决策信息系统验证了该算法的有效性,使协调序决策信息系统的属性约简得到了扩展.在不协调序决策信息系统中引入限定条件熵、限定互信息概念,并给出基于限定互信息的不协调序决策信息系统属性约简算法,为不协调序决策信息系统的属性约简的应用提供了可行的解决方法. 相似文献
13.
随着对粗糙集理论研究的的深入,基于信息论的信息熵陆续被引入到粗糙集研究中,陆续产生了一些如条件熵、联合熵、知识熵、决策熵、知识粗糙熵、粗集粗糙熵等新的概念,尽管丰富了粗糙集理论和应用,但使用中存在语义不统一的地方,甚至缺乏必要的说明和证明。对这些有价值的新概念作了系统的、严格的、规范的定义及阐述,给出了它们的公式表示,同时,通过相关熵的运算揭示彼此间的关系,最后指出这些熵的应用范畴,以便研究人员在清楚概念的基础上作进一步研究。 相似文献
14.
在粗糙集不确定性度量公式中,模糊熵和模糊度是重要的度量方式。根据粗糙集不确定性度量中模糊熵和新的模糊度公式,提出了在决策信息系统中修正条件信息熵和相对模糊熵的概念,并分别用两种方式证明了熵在属性约简过程中的单调性。然后利用向前添加属性算法进行属性约简,约简结果在RIDAS(roughset based intelligent data analysis system)平台上进行识别率测试,通过实验对比分析了两种新的信息熵与条件信息熵的约简结果,为基于信息熵的属性约简提供了参考。 相似文献
15.
基于新的条件熵的决策表约简方法 总被引:2,自引:0,他引:2
分析了在知识约简过程中现有条件熵的不足,在一致和不一致对象分开的基础上,定义了一种新的条件熵概念,以弥补现有信息熵的不足,在此基础上给出了以不等式为条件的约简判定定理;然后以条件属性子集的条件熵来度量其对决策分类的重要性,提出了一种新的知识约简启发式方法.应用实例分析的结果表明,基于新的条件熵的属性重要性是一种更准确、更有效的启发式信息,该方法时间复杂度较低,有助于搜索最小或次优知识约简. 相似文献
16.
近年来,人们越来越关注粗糙集中的属性约简算法,尤其是启发式的约简算法。为了度量属性重要度,人们把各种不同的信息熵模型应用到粗糙集中,同时在信息熵这一理论的基础上得出了许多约简算法,用来解决粗糙集中属性约简的问题。然而,现有的基于信息熵的方法还存在一系列问题。针对这些问题,本文首先将知识粒度与相对决策熵这2个概念结合在一起,从而引入一种新的信息熵模型--粒度决策熵;然后,利用粒度决策熵来度量属性的重要性,并由此得出新的约简算法--ARGDE约简算法;最后,用不同的UCI数据集来做实验,通过与已有的约简算法比较,该算法能够得到更好的实验结果。 相似文献
17.
18.
考虑到不完备信息系统中属性的相似关系和缺失值对系统不确定性的影响,如果仍然利用分块大小来衡量知识的信息量或粗糙性将变得不合理。本文在信息系统中定义了模糊测度系统信息熵、知识粗糙熵和粗集粗糙熵,证明了模糊测度粗糙熵的合理性及其性质,并举例说明如何选择合理的测度计算模糊测度粗糙熵,最后运用到知识的约简,为信息系统的约简提供了一种新的途径。 相似文献