共查询到19条相似文献,搜索用时 204 毫秒
1.
Pawlak粗糙集的知识约简包括对决策表的知识约简和对信息表的知识约简。作为Pawlak粗糙集的扩展,邻域粗糙集在针对决策表的属性约简方面应用广泛,而针对信息表的属性约简方面应用鲜少。为了设计一种适用于信息表的属性约简算法,根据Pawlak粗糙集的信息表知识约简标准,首先提出一种邻域粗糙集的信息表知识约简标准,然后根据这种标准,结合贪心思想,进一步提出了一种适用于聚类任务的信息表属性约简算法。与主成分分析(principal component analysis,PCA)算法相比,实验结果表明用该算法对数据集降维后,得到的属性约简集合的属性个数较多,K-means算法根据属性集合进行聚类的精度较高。实验结果证明该算法能有效地应用于信息表的属性约简方面。 相似文献
2.
3.
基于差异关系的变精度粗糙集知识约简算法研究 总被引:1,自引:0,他引:1
有效的知识约简算法是粗糙集理论的重要研究内容.粗糙集是一个去掉冗余特征的有效工具.经典的粗糙集方法要求数值用离散数据表达,对于连续值则在处理前必须进行离散化处理.真实数据往往存在连续值,为了避免运用粗糙集方法所必需的离散化过程带来的信息丢失,将差异关系应用于粗糙集的知识约简.为进一步增强差异关系粗糙集对噪声数据的适应能力,提出基于差异关系的变精度粗糙集知识约简算法,并分析差异关系下变精度粗糙集模型参数的特性,给出依赖度和参数范围关系描述,将参数取值从点扩展到区间范围.在UCI数据库的数据集上进行实验,结果证明了所提方法及相关理论的有效性. 相似文献
4.
5.
传统的基于粗糙集与支持向量机的故障诊断方法在用支持向量机分类前用粗糙集进行数据约简,仅将粗糙集作为数据约简的工具,忽视了粗糙集所获取的决策规则对原有数据中所隐含知识的概括表达作用.本文提出了一种改进的基于粗糙集与支持向量机的故障诊断方法,首先基于粗糙集对样本数据进行约简和初步决策规则获取,然后将获取的规则作为先验知识集成到支持向量机中进行故障诊断.该方法结合了粗糙集的处理高维数据的优点和支持向量机具有较高推广能力的优势,并且在用支持向量机分类时有效地利用了粗糙集获取的决策规则,提高了故障诊断的准确率.使用该方法对柴油机常见故障进行诊断实验,结果表明了方法的有效性. 前用粗糙集进行数据约简,仅将粗糙集作为数据约简的工具,忽视了粗糙集所获取的决策规则对原有数据中所隐舍知识的概括表达作用.本文提出了一种改进的基于粗糙集与支持向量机的故障诊断方法,首先基于粗糙集对样本数据进行约简和初步决策规则获取,然后将获取的规则作为先验知识集成到支持向量机中进行故障诊断.该方法结合了粗糙集的处理高维数据的优点和支持向量机具有较高推广能力的优势,并且在用支持向量机分类时有效地利用了粗糙集获取的决策规则,提高了故障诊断的准确率.使用该 法对柴油机常见故障进行诊断实验,结果表明了方法的有效性. 前用粗糙集进行数据约简,仅将粗糙集 相似文献
6.
知识约简是基于粗集理论进行数据挖掘的重要步骤获取最优知识约简是典型的Np-hard问题.在实际应用中,数据属性往往具有成本约束,并且数据本身含有噪声.本文提出了将粗集理论与遗传算法相结合来求解这种信息表的最优知识约简和近似知识约简的方法实验结果表明该方法具有很强的全局搜索能力,在有限的代数内找到信息表的最优约简:最小基约简集、最小成本约简集.当信息表含有噪声数据时,该方法能找出信息表的近似知识约简. 相似文献
7.
从粒度计算的角度对粗糙集理论的属性约简进行研究,分别基于代数方法和信息论方法定义了粒度差和粒度熵的概念,并在此基础上提出了两种新的属性约简算法.实验分析表明,这两种可靠有效的粒度计算方法都能得到信息表的最小约简,为进一步研究知识的粒度计算提供了可行的方法. 相似文献
8.
粗糙集理论是一种采用新方式来研究不精确、不确定性知识的数学工具。属性约简的计算是粗糙集理论中的一个重要问题。描述基于粗糙集的属性约简的相关概念,包括核、约简、分类精度;通过分析多种属性约简算法,结合可辨识矩阵和逻辑运算,提出了一种属性约简算法;围绕高校中的管理信息系统,利用该算法抽取与学生就业相关的数据信息,给出了影响学生就业的各条件因素与工作方向之问的依赖关系和约简后的数据表;获取相关规则得出结论,取得了良好的效果。 相似文献
9.
多源信息融合故障诊断方法可以有效提高设备故障的确诊率,但同时需要使用由不同传感器获取的多种故障特征数据.此时若将所有特征的数据用于诊断,则计算量过大,诊断的实时性差.对此,将证据理论与粗糙集相结合,提出基于信度区间的属性约简定理及相应的故障特征(属性)约简方法,力图利用约简后的重要特征进行快速诊断.利用随机模糊变量和K均值对特征数据进行离散化处理,通过压缩二进制矩阵获取核属性,再将属性的信度区间大小作为迭代约简过程中属性的选取标准,向核属性中添加重要属性,最终获得属性约简结果.最后进行电机转子的特征融合诊断实验,通过与经典的粗糙集简约方法对比验证所提出方法的有效性. 相似文献
10.
随着互联网的发展,各种文本信息资源量急剧增加.如何从海量信息中挖掘出这些有用的并进行分类、获取其中潜在的信息,已经成为数据挖掘、知识发现和中文文本处理等领域的一项最新的研究课题.粗糙集理论是一种对不确定数据进行分类的数学工具,在保持基本的分类能力不变的情况下,进行属性和知识约简,从而减少数据挖掘的原始数据,提高知识发现的效率.将粗糙集属性约简算法运用于文本主客观性研究中,提高了文本主客观性判断的效率. 相似文献
11.
12.
13.
14.
15.
粗糙集理论中概念与运算的信息表示* 总被引:163,自引:1,他引:162
粗糙集理论对知识进行了形式化定义,为知识处理提供了一套严密的分析工具,但在代数表示下,粗糙集理论的本质不易被理解,并且,尚无高效的知识约简算法.该文首先建立了知识与信息之间的关系;然后,在此基础上给出了粗糙集理论中概念与运算的信息表示;最后,证明了知识约简在信息和代数两种不同表示下是等价的.这些结论有助于人们深刻理解粗糙集理论的本质,同时,为寻找高效的知识约简算法奠定了基础. 相似文献
16.
属性约简是机器学习等领域中常用的数据预处理方法。在基于粗糙集理论的属性约简算法中,大多是根据单一的方法来度量属性重要度。为了从多角度对属性达到更为优越的评估效果,首先在已有的模糊邻域粗糙集模型中定义属性依赖度度量,然后根据粒计算理论中知识粒度的概念,在模糊邻域粗糙集模型下提出了模糊邻域粒度度量。由于属性依赖度和知识粒度代表了不同视角的属性评估方法,因此将这两种方法结合起来用于信息系统的属性重要度评估,最后给出一种启发式属性约简算法。实验结果表明,所提出的算法具有较好的属性约简性能。 相似文献
17.
利用粗糙集理论,从矩阵分析的角度来挖掘决策表蕴含的信息,引入粗糙集信息等价关系的同构映射——等价矩阵,等价矩阵可看作是等价关系在信息表内的知识表达。给出了等价矩阵的求取算法以及等价矩阵意义下的属性重要度和核的概念。设计了基于等价矩阵的决策信息表的最小属性约简算法。从等价矩阵本身相关操作运算来挖掘客观知识之间的关联模式,提出了基于信息等价矩阵的关联规则提取的算法。实例证明提出的算法有效,为进一步研究决策信息系统的规则提取和决策算法提供了可行的计算方法。 相似文献
18.
粗集理论为从信息论角度研究知识粗糙熵和属性约简问题提供了一种重要的途径和方法。本文提出了基于容差关系下的不完备信息系统加权的知识熵和条件熵概念,将等价关系下的粗糙熵自然地推广到不完备信息系统的容差关系情形。本文的结果为在一般二元关系下的知识获取提供了理论依据。 相似文献