首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
通过分析目前信息观下不完备信息系统属性约简,针对已提出的几种信息熵存在随着属性的增加系统分类能力减弱的不足,从条件属性确定的容差类在决策属性划分上的分布出发,给出不完备决策表的条件分布信息量的定义;同时,定义了新的属性重要度,并以此为启发信息设计属性约简算法。通过实验说明了该算法对不完备决策表属性约简是可行的。  相似文献   

2.
属性重要度和属性约简都是形式概念分析研究中的关注重点.通过信息粒的角度,文中提出基于信息熵研究形式背景的属性约简的一些方法.首先,给出形式背景的信息熵、条件熵及互信息等定义,通过条件熵对协调的决策形式背景进行属性约简,得到形式背景的粒协调和熵协调是等价的.然后,在熵不协调的决策形式背景中定义有限信息熵、有限条件熵和有限互信息,利用有限条件熵对不协调的决策形式背景进行属性约简.最后,基于属性重要度分别设计熵协调和熵不协调的决策形式背景的属性约简算法,通过数值实验验证文中算法的有效性.  相似文献   

3.
信息熵是粗糙集理论中度量不确定信息的重要工具之一。蚁群优化算法是一种新型的智能计算的方法,具有分布式、正反馈及启发性搜索等优良的性质,并且在优化计算中已得到了很多应用.最小属性约简问题也是一类优化问题,已有的属性约简算法主要采用Pawlak正域度量属性的重要度,而且求最小约简是NP-hard问题.为此,在分析信息熵度量不确定性数据的基础上,定义信息熵属性重要度概念,引入蚁群优化算法,提出基于信息熵与蚁群优化的最小属性约简算法.该算法发挥蚁群优化算法良好的寻优能力,大多数情况下能够找到最小约简.理论分析与实验结果表明该算法是有效可行的.  相似文献   

4.
信息系统属性约简的比较研究   总被引:1,自引:0,他引:1  
属性约简是粗糙集理论研究的核心问题之一。利用信息熵定义了信息系统的熵约简,从代数与信息熵两种不同角度出发对属性约简进行讨论。通过比较分析,分别在信息系统、协调与不协调决策表中得到这两种观点下属性约简的一些等价关系和蕴含关系,揭示了不同意义下属性约简的本质联系。  相似文献   

5.
属性最小约简是NP完全问题,该问题的研究一直被关注.如,以不可分辨矩阵为基础的传统约简方法[1],基于属性重要性的约简方法[1]等等,这些方法对于大数据集都是不实用的.文[8]提出了以遗传算法全局搜手能力为基础的属性约简方法,文[3]通过引进属性依赖启发信息改进了文[8]中的方法.本文中,先给出了一个时间复杂度为O(k×n×log n),空间复杂度为O(n)的核属性判别方法.然后,以此为基础给出了较文[3]和文[8]中更有效的遗传粗糙约简算法.  相似文献   

6.
不完备信息系统中的属性约简是粗集理论应用的难点。通过引入信息熵和条件信息熵,对信息系统中属性的必要性进行了定义,提出了一种基于条件信息熵的属性约简启发式算法。通过引入相对正域,有效地解决了不一致系统属性约简过程中产生的冗余属性问题,并分析了该算法的时间复杂度。最后,通过实例说明该算法能得到不完备决策表的最小相对约简。  相似文献   

7.
利用覆盖算法对数据进行处理,得到论域U的一个划分,定义一种基于覆盖的条件信息熵,由新的条件信息熵定义新的属性重要性,并证明了对于一致决策表,它与代数定义下的重要性是等价的。以新的属性重要性为启发信息设计约简算法,并给出计算新的条件信息熵的算法。实验结果表明该约简算法能快速搜索到最优或次优约简。  相似文献   

8.
针对现有的决策形式背景属性约简方法不能处理多粒度数据的问题,文中提出3种多粒度决策形式背景的属性约简方法,目的是通过删除每个协调粒度层下相同类别的类属性块,实现信息系统的属性约简.首先从信息粒的角度出发,在多粒度决策形式背景中引入协调粒度层的信息熵及条件信息熵,利用它们进一步度量属性重要度.然后,在多粒度决策形式背景中基于平均条件信息熵、最粗协调决策形式背景条件信息熵及最细协调决策形式背景条件信息熵,提出协调粒度约简方法、最粗协调粒度约简方法、最细协调粒度约简方法及其实现算法.最后,通过实验验证文中提出的3种属性约简方法的有效性,对比这3种方法得到的属性约简集,发现协调粒度约简方法的约束条件较严,相比之下,最粗协调粒度约简方法和最细协调粒度约简方法约束条件相对宽松.  相似文献   

9.
为在决策表中获得更好的属性约简组合,从信息论角度分析,在基于区分矩阵的基础上,提出一种改进的以条件熵作启发信息的约简算法。同时考虑条件属性相对于决策属性的条件信息熵以及属性值的分布情况,用它们的比作为启发因子,重新给出一种度量属性重要度的依据,得到属性约简集。实验结果表明,该算法能够有效约简属性集,使约简结果获得最简决策规则组合。  相似文献   

10.
一种基于新的条件信息熵的高效知识约简算法   总被引:16,自引:1,他引:15  
分析了在知识约简过程中现有条件信息熵的不足,给出一种新的条件信息熵,由此定义新的属性重要性.将其与基于正区域和基于现有条件信息熵的属性重要性进行比较,结果表明新的属性重要性是一种更准确、更全面的启发信息.以新的属性重要性为启发信息设计约简算法,并给出计算新的条件信息熵的高效算法.理论分析和实验结果表明,与基于现有条件信息熵的约简算法相比,该约简算法时间复杂度较低,且在搜索最小或次优约简方面更优.  相似文献   

11.
12.
Searching for reducts is a basic problem for many rough set methods like rule induction, classification, etc., Many of them can not be realized in exact way because of existing possibly exponential number of (relative) reducts in decision tables. In this paper we investigate properties of the most malicious decision tables, i.e., tables with maximal number of reducts. We show that in such systems, the number of objects must be also exponential. The presented method is based on Boolean reasoning approach.  相似文献   

13.
徐宁  章云 《计算机科学》2004,31(Z2):85-90
1引言 Rough集理论是波兰数学家Z.Pawlak教授上世纪80年代初提出的研究成果[1,2],在此10年后,90年代初另两位波兰数学家A.Skowron教授和C.Rauszer教授在Rough集研究的基础上提出了关于数据集属性约简的区分矩阵(discernibility matrix)和区分函数(discernibility function)[3]方法,使数据表属性约简的研究摆脱了亦步亦趋和启发式的状态,展开了新的一页.  相似文献   

14.
直觉模糊决策系统是模糊决策系统的扩展,其中条件属性值均为直觉模糊元。讨论属性值之间带有序关系的直觉模糊决策系统,即直觉模糊序决策系统。首先,引入直觉模糊序决策系统的部分一致约简,并证明了在一致直觉模糊序决策系统中,部分一致约简恰为相对约简,因此部分一致约简是相对约简在不一致直觉模糊序决策系统中的扩展。其次,给出求解直觉模糊序决策系统全部部分一致约简的部分一致辨识矩阵和辨识函数。然后,介绍了部分一致约简的两种等价形式:下约简和下近似约简。最后,用实例验证了约简计算方法的可行性。  相似文献   

15.
集成学习被广泛用于提高分类精度, 近年来的研究表明, 通过多模态扰乱策略来构建集成分类器可以进一步提高分类性能. 本文提出了一种基于近似约简与最优采样的集成剪枝算法(EPA_AO). 在EPA_AO中, 我们设计了一种多模态扰乱策略来构建不同的个体分类器. 该扰乱策略可以同时扰乱属性空间和训练集, 从而增加了个体分类器的多样性. 我们利用证据KNN (K-近邻)算法来训练个体分类器, 并在多个UCI数据集上比较了EPA_AO与现有同类型算法的性能. 实验结果表明, EPA_AO是一种有效的集成学习方法.  相似文献   

16.
变精度粗糙集模型约简特征分析*   总被引:1,自引:1,他引:0  
阐明了变精度粗糙集模型中,经典粗糙集模型分类质量、相对正域、决策类下近似不再具有非单调递减特征,在约简过程中分类质量和相对正域会出现跳跃现象,约简过程具有不稳定性;但决策类下近似不会出现跳跃现象,可以得到稳定的约简过程;并且三者之间打破了在经典粗糙集模型中的等价性,需要针对三者分别建立模型,使属性约简变得多样化。  相似文献   

17.

A fundamental problem in data mining is whether the whole information available is always necessary to represent the information system (IS). Reduct is a rough set approach in data mining that determines the set of important attributes to represent the IS. The search for minimal reduct is based on the assumption that within the dataset in an IS, there are attributes that are more important than the rest. An algorithm in finding minimal reducts based on Propositional Satisfiability (SAT) algorithm is proposed. A branch and bound algorithm is presented to solve the proposed SAT problem. The experimental result shows that the proposed algorithm has significantly reduced the number of rules generated from the obtained reducts with high percentage of classification accuracy.  相似文献   

18.
基于粗糙集约简的特征选择神经网络集成技术   总被引:1,自引:0,他引:1  
为了提升集成网络的泛化性能,在Boosting或Bagging算法对样本进行扰动的基础上,通过粗糙集约简实现特征属性选择,将样本扰动和输入属性扰动结合起来,提出了Rough_Boosting和Rough_Bagging算法.该算法通过生成精确度高且差异度大的个体网络,提高了集成的泛化能力.实验结果表明,该算法泛化能力明显优于Boosting和Bagging算法,且生成的个体网络差异度更大,与同类算法相比,具有相近或相当的性能.  相似文献   

19.
粗糙集理论的概念性框架之一就是利用不可分辨关系和布尔推理作为数据约简和获取决策规则的基础.在分辨矩阵和决策矩阵概念的基础上,提出将约简分为4类,即信息表的对象约简、信息表的全局约简、决策表的对象约简和决策表的全局约简,其中决策表的对象约简对应决策规则.从模式的角度对约简和决策规则进行了分析,利用决策矩阵和决策函数,给出了获取最小决策规则的一种算法,上述结论可以作为设计启发式算法的基础,并用例子对结论进行了说明.  相似文献   

20.
数据流挖掘是当前数据挖掘研究的一个热点,概念漂移检测是数据流挖掘的一个重要研究方向.虽然有不少概念漂移的探测方法,但是它们都有一些共同的缺陷:没有整体上删除冗余属性以及利用外部属性去探测概念漂移(比如利用对外部数据的分类准确率)等.利用粗糙集和F-粗糙集的基本原理和基本方法,把数据流中的滑动窗口当成决策子表簇,提出了一种对数据流进行并行约简、整体删除冗余属性的方法,并运用并行约简后数据流决策子表簇中属性重要性的变化探测概念漂移现象.与传统的方法不同,新方法利用数据的内部特性对概念漂移进行探测.实验结果显示,该方法能够有效地整体删除冗余属性、探测概念漂移现象,并且基于互信息的属性重要性在概念漂移探测效果方面比基于正区域的属性重要性要好些.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号