共查询到10条相似文献,搜索用时 62 毫秒
1.
2.
针对现有属性约简算法存在的问题,利用信息论和粗糙集理论,提出一种基于相对可辨识矩阵的决策表属性约简算法.该算法以核属性为基础,通过建立相对可辨识矩阵,利用条件信息熵作为启发式信息,减少属性约简过程中的搜索空间,逐个添加条件信息熵最大的属性,直到找出最小约简为止,并分析了该算法的时间复杂度.实例分析结果表明,该算法能有效地对决策表属性进行约简. 相似文献
3.
彭慧伶 《计算机与数字工程》2010,38(5):31-34,95
提出了一种基于最佳分类数和粗糙集理论的汽轮机轴系振动故障诊断方法。该方法利用模糊C均值聚类算法(FCM)把数据的连续属性离散化,以形成隶属度矩阵及属性分类数,根据隶属度矩阵及属性分类数进行划分系数和划分熵的有效性评判,最终找到连续属性的最佳分类数。然后根据最佳分类数对数据的连续属性进行实际的离散化,将离散化后形成的离散数据根据粗糙集理论,进行数据挖掘,得到诊断规则,有效提高了汽轮机轴系振动故障的诊断水平。 相似文献
4.
基于广义差别矩阵的核和属性约简算法 总被引:13,自引:1,他引:12
属性约简是粗糙集理论的重要研究内容.为此引入广义差别矩阵,提出基于广义差别矩阵的核和属性约简算法.该框架可有效避免连续属性值离散化,且有利于与其他机器学习方法相结合.理论分析表明,所提出的算法是有效而可行的. 相似文献
5.
连续属性离散化作为水产品安全信息系统中进行智能化数据处理的一个重要研究内容,已然成为水产品安全信息化研究领域的一个热点和难点。文中利用基于粗糙集理论相对熵的连续属性离散化方法来解决这个问题。此方法选用候选区间的类信息熵作为离散门限值边界,并且通过考察每个属性值的分类能力,合并离散区间,去掉冗余断点,确定关键离散属性值,最终在水产品安全信息系统中实现连续属性离散化。实例分析表明算法是有效可行的。 相似文献
6.
C4.5算法是一种非常有影响力的决策树生成算法,但该方法生成的决策树分类精度不高,分支较多,规模较大.针对C4.5算法存在的上述问题,本文提出了一种基于粗糙集理论与CAIM准则的C4.5改进算法.该算法采用基于CAIM准则的离散化方法对连续属性进行处理,使离散化过程中的信息丢失程度降低,提高分类精度.对离散化后的样本用基于粗糙集理论的属性约简方法进行属性约简,剔除冗余属性,减小生成的决策树规模.通过实验验证,该算法可以有效提高C4.5算法生成的决策树分类精度,降低决策树的规模. 相似文献
7.
粗糙集连续属性离散化模型研究与应用要点分析 总被引:10,自引:0,他引:10
基于粗糙集理论,研究连续属性离散化问题的本质特点,提出粗糙集指标衡量和优化算法结构相统一的离散化思想,设计通用的离散化方法模型。分析主流的SOM网络、GA、层次聚类、信息熵等主流聚类方法的特点,并基于这种结构模型,给出了相应离散化方法的应用要点。 相似文献
8.
9.
10.
聂林娣 《数字社区&智能家居》2009,(9)
数据挖掘是近年来数据库领域中出现的一个新兴研究热点,它是从大量数据中获取知识。进行数据挖掘的方法很多,粗糙集方法便是其中的主要方法之一。属性约简算法是基于粗糙集理论的数据挖掘模型中的关键步骤,同时也是粗糙集理论研究中的一个研究重点。通过对粗糙集理论的属性约简算法的深入研究,本文提出了一种改进的属性约简启发式算法。该算法建立在可辨识矩阵计算基础上。改进算法基于Hu的算法与Jelonek算法,在计算可辨识矩阵的基础上,保证最终能够找到决策信息系统的一个约简,同时较Jelonek算法相比,运算时间明显减少。 相似文献