首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 49 毫秒
1.
以分类为基础提出一种基于条件熵的决策表属性约简算法。通过条件熵的计算在属性约简的同时将原决策表逐层分解成相对于决策属性来说尽量均匀的子决策表,从而缩小了数据规模;随后对算法的时间复杂度进行了分析;实验表明,该算法在效率方面优于传统算法。  相似文献   

2.
粗糙集是一种处理不确定、不完全知识的数学工具,属性约简是粗糙集理论的重要研究内容之一。提出了一种基于条件熵的快速增量约简方法,主要分析了在对象动态增加情况下信息熵的变化机制。该算法通过判断更新前决策表的约简属性对新增对象的区分情况来计算新的条件熵值,就可以快速求解出更新后的决策表的属性约简结果。实验结果也进一步验证了该方法的有效性。  相似文献   

3.
本文以分类为基础提出了一种基于条件熵的决策表属性并行约简算法。该算法通过条件熵的计算在属性约简的同时将原决策表逐层分解为相对于决策属性来说尽量均匀的子决策表,从而实现了属性约简的并行计算。本文随后对该算法的时间复杂度进行了分析,实验表明,该算法在效率方面优于传统算法。  相似文献   

4.
基于相对熵的一种属性约简算法   总被引:6,自引:0,他引:6  
知识约简是粗糙集理论研究的主要内容之一。在信息系统中引入了知识的相对熵的概念,证明了在知识相对约简过程中相对熵的变化趋势是递减的;利用相对熵的概念,定义了属性的相对重要性,提出了一种基于相对熵的新的属性约简启发式算法,该算法的时间复杂度为O(|C|3|U|2),通过例子分析,表明该算法是有效的。  相似文献   

5.
目前粗糙集的研究局限于有限集,且现有的邻域粗糙集属性约简算法中属性重要性度量方式单一。针对邻域粗糙集存在的问题,提出了基于无限集的邻域近似条件熵模型。该模型以邻域近似条件熵下的属性重要度为启发条件,构造了一种基于邻域近似条件熵的前向贪心搜索属性约简算法。利用熵的单调性,证明了算法的正确性,并分析了算法的时间复杂度。通过实例分析和多个UCI数据集上的实验表明,所提出的算法是可行的,能有效减少属性数量,与现有的算法相比,不仅能够获得较小的属性约简结果,而且具有较好的分类性能。  相似文献   

6.
基于新的条件熵的决策表约简方法   总被引:2,自引:0,他引:2  
分析了在知识约简过程中现有条件熵的不足,在一致和不一致对象分开的基础上,定义了一种新的条件熵概念,以弥补现有信息熵的不足,在此基础上给出了以不等式为条件的约简判定定理;然后以条件属性子集的条件熵来度量其对决策分类的重要性,提出了一种新的知识约简启发式方法.应用实例分析的结果表明,基于新的条件熵的属性重要性是一种更准确、更有效的启发式信息,该方法时间复杂度较低,有助于搜索最小或次优知识约简.  相似文献   

7.
基于区分矩阵的属性约简算法研究   总被引:4,自引:0,他引:4  
粗糙集理论是近年来发展起来的一种有效地处理不精确、不确定的软计算工具,在机器学习、数据挖掘、智能数据分析、控制算法获取等领域取得了成功的应用。本文主要对基于粗糙集理论的属性约筒算法进行了研究,并取得了一定成果。在约简算法方面,对核集为空的决策表,分析了基于区分矩阵的属性约简算法的局限性,提出了一种新的适用于无核决策表的属性约简方法。  相似文献   

8.
出于不同的应用目的,许多学者提出了各种不同的属性约简概念.给出相对熵保持不变的条件,利用相对熵定义了决策表的相对熵约简,证明相对熵约简与HU的差别矩阵和差别函数的约简方法是等价的.  相似文献   

9.
基于元素约简的决策表属性约简算法   总被引:1,自引:1,他引:0       下载免费PDF全文
Skowron差别矩阵广泛应用于属性约简及求核运算,但它只适用于相容决策表,对于不相容决策表有时会得到错误的结果。虽然国内多位学者对它进行了改进,但一方面它们仍只适用于相容或部分相容决策表的属性约简,对完全不相容决策表仍得不到正确的结果。另一方面须通过额外的函数来约束差别矩阵的构造过程,增加计算负担。利用等价差别矩阵具有相同属性约简的思想,将元素对象分割成相容对象与矛盾对象,通过对参与构造差别矩阵的行与列元素进行约简,减少了某些重复计算过程,提高了计算效率。以此为基础,给出了一种改进的属性约简算法。数值算例验证了该算法是有效可行的。  相似文献   

10.
粗糙集理论中最重要的内容之一就是属性约简问题,现有的许多属性约简算法往往是基于属性对分类的重要性,如果属性约简的结果能满足用户实际需要的信息,如成本、用户的偏好等,那么约简理论将会有更高的实用价值。基于此,从信息熵的角度定义了带权重的属性重要性,然后重新定义了基于带权重的属性重要性的熵约简算法。最后通过实际例子说明,与基于属性重要性的嫡约简算法相比,考虑权重的算法更加符合用户的实际需求。  相似文献   

11.
在分析和研究C5算法中连续属性处理的必要性及C5算法中离散化方法的不足后,采用基于粗糙集理论-信息熵-可辨识矩阵的离散化的方法(RSIEDM)进行离散化。该方法利用粗糙集、信息熵和可辨识矩阵能更合理、更准确地对连续属性进行离散化,使创建的决策树具有更好的准确率。在优化雷电灾害统计和评估雷电灾害导致的损失应用中,该算法取得了较好的效果。  相似文献   

12.
分析HORAFA算法和HORAFA-A算法的不足,给出一种获得最优约简的启发式算法.算法以核属性为初始约简集,以属性频率为启发式信息,选择必要的属性加入约简集.该算法不仅适用于相容决策表系统,也适用于不相容决策表系统;同时,改进了反向消除方法,可以更快速地删除多余条件属性.实验表明,该算法是正确的,并且效率优于HORAFA-A算法.  相似文献   

13.
结合粗糙集和模糊聚类方法的属性约简算法   总被引:5,自引:2,他引:5  
本文针对粗糙集理论的属性约简算法进行了研究。结合模糊聚类方法,提出了一个新的属性约简算法,用户可以根据实际决策需要和领域知识更改阈值λ,从而得到用户满意的属性约简结果。最后利用该文的算法给出了一个实例的约筒结果。  相似文献   

14.
基于粗糙集的一种属性值约简算法及其应用   总被引:1,自引:0,他引:1  
阐述粗糙集理论的基本概念,并且对属性约简和值约简算法进行研究,提出了一种基于粗糙集的属性值约简算法.通过实例介绍该算法的应用.研究表明,该算法不仅能得到最佳的决策规则,而且能够大大降低信息系统所需的存储空间,该算法可以解决各种有关的实际问题.  相似文献   

15.
属性约筒是粗糙集理论的重要研究内容之一,以浓缩树结构存储区分矩阵中的非空数据项,对IReductBtree算法进行了一些改进.它是根据树结构特点结合特殊的启发式策略,删除树中结点,直到树空最后得到信息系统的一个约简.最后,通过一个实例完整演示了该方法证实其有效性.  相似文献   

16.
入侵检测数据具有信息冗余量大、标记数据难以获得等特点。传统入侵检测方法难以消除冗余信息并且需要大量已标记样本做训练集,导致检测效率降低,实用性下降。为了解决上述问题,提出一种结合属性约简与半监督协同训练的算法。该算法充分发挥了大量未标记样本的监督作用。首先将入侵数据进行属性约简,利用约简结果建立一个支持向量机(SVM)基分类器,然后将其与另外两个SVM辅助分类器做协同训练。如此,分类器界面得到反复修正,分类器的性能逐步得到改善,最终分类精度得到明显提高。在入侵检测数据集KDDCUP99上的仿真实验结果表明,该算法不仅可以提高检测精度,同时还具有良好的可行性、稳定性。  相似文献   

17.
基于属性重要性的属性约简算法   总被引:2,自引:0,他引:2  
粗糙集理论是一个新的处理不确定性问题的数学工具,属性约简是粗糙集理论的核心问题之一。为了获得决策系统中更好的相对属性约简,提出一种基于属性重要性的属性约简算法。将可辨识矩阵中出现次数多少作为属性重要性的判断依据。算法还考虑了当出现次数相同的情况下属性选择问题,由此定义新的属性重要性,以新的属性重要性为启发信息,分析表明,提出的算法是有效可行的。  相似文献   

18.
文献[6]给出的基于简化二进制可分辨矩阵的快速属性约简算法是不完备的,并且在处理大数据集时的效率不很理想.提出一种基于二进制有序差别集的属性约简算法,该算法不需要创建二进制可分辨矩阵,减少了数据处理量,大大提高了约简的效率,使算法的时间复杂度和空间复杂度分别降为max{O(|C|2|U/C|2),O(|C|2|BMsCount|)}和O(|BMsCount |).最后的实验结果表明该算法是正确的、高效的.  相似文献   

19.
对于有缺损值的非完备信息系统约简,多数算法利用容差关系求信息量,但此类算法需消耗大量时间计算容差,导致属性约简质量、消耗的时间及空间复杂度均不理想。为了有效提高求容差类计算效率,引入一个与相容类信息量等价的计算公式。以此为基础,提出一种属性约简算法,使时间复杂度降为O(|C|~2|U|),空间降为O(|C||U|)。最后,通过实例和实验分析并验证了算法的有效性和可行性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号