首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 204 毫秒
1.
Pawlak粗糙集的知识约简包括对决策表的知识约简和对信息表的知识约简。作为Pawlak粗糙集的扩展,邻域粗糙集在针对决策表的属性约简方面应用广泛,而针对信息表的属性约简方面应用鲜少。为了设计一种适用于信息表的属性约简算法,根据Pawlak粗糙集的信息表知识约简标准,首先提出一种邻域粗糙集的信息表知识约简标准,然后根据这种标准,结合贪心思想,进一步提出了一种适用于聚类任务的信息表属性约简算法。与主成分分析(principal component analysis,PCA)算法相比,实验结果表明用该算法对数据集降维后,得到的属性约简集合的属性个数较多,K-means算法根据属性集合进行聚类的精度较高。实验结果证明该算法能有效地应用于信息表的属性约简方面。  相似文献   

2.
粗糙集是一种软计算方法,它不需要任何先验知识和理论推导,仅依赖于原始数据,从数据中发现潜在规律和隐含规则,其核心任务是数据约简,得到最简决策规则。文章基于粗糙集理论的可辨识矩阵算法,对滚动轴承故障信息表进行属性约简和属性值约简,得到了精简的诊断规则,从而方便了信息的机器处理,也为基于规则的滚动轴承智能故障诊断系统提供了一种更为简单的知识库自动构造方法。  相似文献   

3.
基于差异关系的变精度粗糙集知识约简算法研究   总被引:1,自引:0,他引:1  
焦娜 《计算机科学》2015,42(5):265-269
有效的知识约简算法是粗糙集理论的重要研究内容.粗糙集是一个去掉冗余特征的有效工具.经典的粗糙集方法要求数值用离散数据表达,对于连续值则在处理前必须进行离散化处理.真实数据往往存在连续值,为了避免运用粗糙集方法所必需的离散化过程带来的信息丢失,将差异关系应用于粗糙集的知识约简.为进一步增强差异关系粗糙集对噪声数据的适应能力,提出基于差异关系的变精度粗糙集知识约简算法,并分析差异关系下变精度粗糙集模型参数的特性,给出依赖度和参数范围关系描述,将参数取值从点扩展到区间范围.在UCI数据库的数据集上进行实验,结果证明了所提方法及相关理论的有效性.  相似文献   

4.
基于知识约简的网络入侵特征提取   总被引:2,自引:0,他引:2       下载免费PDF全文
为改善入侵检测系统的性能,提出一种基于知识约简的特征提取方法,根据粗糙集理论给出入侵检测系统的形式化描述,使用知识约简提取属性特征,通过信息损耗和信息增益分别控制连续数值属性特征的离散化和属性特征的约简过程。实验结果证明,该方法可有效消除初始数据中的冗余信息和数据噪声。  相似文献   

5.
传统的基于粗糙集与支持向量机的故障诊断方法在用支持向量机分类前用粗糙集进行数据约简,仅将粗糙集作为数据约简的工具,忽视了粗糙集所获取的决策规则对原有数据中所隐含知识的概括表达作用.本文提出了一种改进的基于粗糙集与支持向量机的故障诊断方法,首先基于粗糙集对样本数据进行约简和初步决策规则获取,然后将获取的规则作为先验知识集成到支持向量机中进行故障诊断.该方法结合了粗糙集的处理高维数据的优点和支持向量机具有较高推广能力的优势,并且在用支持向量机分类时有效地利用了粗糙集获取的决策规则,提高了故障诊断的准确率.使用该方法对柴油机常见故障进行诊断实验,结果表明了方法的有效性. 前用粗糙集进行数据约简,仅将粗糙集作为数据约简的工具,忽视了粗糙集所获取的决策规则对原有数据中所隐舍知识的概括表达作用.本文提出了一种改进的基于粗糙集与支持向量机的故障诊断方法,首先基于粗糙集对样本数据进行约简和初步决策规则获取,然后将获取的规则作为先验知识集成到支持向量机中进行故障诊断.该方法结合了粗糙集的处理高维数据的优点和支持向量机具有较高推广能力的优势,并且在用支持向量机分类时有效地利用了粗糙集获取的决策规则,提高了故障诊断的准确率.使用该 法对柴油机常见故障进行诊断实验,结果表明了方法的有效性. 前用粗糙集进行数据约简,仅将粗糙集  相似文献   

6.
知识约简是基于粗集理论进行数据挖掘的重要步骤获取最优知识约简是典型的Np-hard问题.在实际应用中,数据属性往往具有成本约束,并且数据本身含有噪声.本文提出了将粗集理论与遗传算法相结合来求解这种信息表的最优知识约简和近似知识约简的方法实验结果表明该方法具有很强的全局搜索能力,在有限的代数内找到信息表的最优约简:最小基约简集、最小成本约简集.当信息表含有噪声数据时,该方法能找出信息表的近似知识约简.  相似文献   

7.
从粒度计算的角度对粗糙集理论的属性约简进行研究,分别基于代数方法和信息论方法定义了粒度差和粒度熵的概念,并在此基础上提出了两种新的属性约简算法.实验分析表明,这两种可靠有效的粒度计算方法都能得到信息表的最小约简,为进一步研究知识的粒度计算提供了可行的方法.  相似文献   

8.
粗糙集理论是一种采用新方式来研究不精确、不确定性知识的数学工具。属性约简的计算是粗糙集理论中的一个重要问题。描述基于粗糙集的属性约简的相关概念,包括核、约简、分类精度;通过分析多种属性约简算法,结合可辨识矩阵和逻辑运算,提出了一种属性约简算法;围绕高校中的管理信息系统,利用该算法抽取与学生就业相关的数据信息,给出了影响学生就业的各条件因素与工作方向之问的依赖关系和约简后的数据表;获取相关规则得出结论,取得了良好的效果。  相似文献   

9.
多源信息融合故障诊断方法可以有效提高设备故障的确诊率,但同时需要使用由不同传感器获取的多种故障特征数据.此时若将所有特征的数据用于诊断,则计算量过大,诊断的实时性差.对此,将证据理论与粗糙集相结合,提出基于信度区间的属性约简定理及相应的故障特征(属性)约简方法,力图利用约简后的重要特征进行快速诊断.利用随机模糊变量和K均值对特征数据进行离散化处理,通过压缩二进制矩阵获取核属性,再将属性的信度区间大小作为迭代约简过程中属性的选取标准,向核属性中添加重要属性,最终获得属性约简结果.最后进行电机转子的特征融合诊断实验,通过与经典的粗糙集简约方法对比验证所提出方法的有效性.  相似文献   

10.
随着互联网的发展,各种文本信息资源量急剧增加.如何从海量信息中挖掘出这些有用的并进行分类、获取其中潜在的信息,已经成为数据挖掘、知识发现和中文文本处理等领域的一项最新的研究课题.粗糙集理论是一种对不确定数据进行分类的数学工具,在保持基本的分类能力不变的情况下,进行属性和知识约简,从而减少数据挖掘的原始数据,提高知识发现的效率.将粗糙集属性约简算法运用于文本主客观性研究中,提高了文本主客观性判断的效率.  相似文献   

11.
基于广义粗集覆盖约简的粗糙熵   总被引:13,自引:0,他引:13  
黄兵  何新  周献中 《软件学报》2004,15(2):215-220
在广义粗集覆盖约简理论中,由于集合的上下近似是由其覆盖约简来确定的,因此有必要寻求一种新的度量来刻画知识和粗集的粗糙性.通过引入信息熵以刻画广义粗集覆盖约简的知识粗糙性以及粗集粗糙性,提出了一种新的知识粗糙性和粗集粗糙性度量.得到知识粗糙熵和粗糙集的粗糙熵都随广义覆盖约简的变细而单调减少的结论,从信息论观点出发,对不完备信息系统粗集理论进行了探讨.  相似文献   

12.
基于条件信息熵的决策表约简   总被引:313,自引:8,他引:313  
Rough集理论是近年来发展起来的一种有效地处理不精确、不确定、含糊信息的数学理论方法,在机器学习、数据挖掘、智能数据分析、控制算法获取等领域取得了很大的成功。研究者从不同的角度对这个理论进行研究。本文将从信息论观点出发对Rough集理论的基本概念和主要运算进行分析讨论,通过与Rough集理论的代数观点进行比较分析,得到这两种观点下的一些等价性质和不同的特性,并基于条件信息熵提出决策表的约简算法。  相似文献   

13.
针对具有动态特征的信息系统,在S-粗集属性迁移理论基础上,给出了S-粗集上的区分矩阵,提出了一种基于S-粗集区分矩阵的属性约简算法.该算法弥补了Z.Pawlak粗集理论对于动态系统知识发现的局限,通过属性迁移对不完备的信息系统进行动态扩展.约简后生成的规则简单准确.本文的算法具有理论与应用的一般性、广泛性,对于现代战场中的删识别,更显示出了极强的优越性.  相似文献   

14.
15.
粗糙集理论中概念与运算的信息表示*   总被引:163,自引:1,他引:162  
苗夺谦  王珏 《软件学报》1999,10(2):113-116
粗糙集理论对知识进行了形式化定义,为知识处理提供了一套严密的分析工具,但在代数表示下,粗糙集理论的本质不易被理解,并且,尚无高效的知识约简算法.该文首先建立了知识与信息之间的关系;然后,在此基础上给出了粗糙集理论中概念与运算的信息表示;最后,证明了知识约简在信息和代数两种不同表示下是等价的.这些结论有助于人们深刻理解粗糙集理论的本质,同时,为寻找高效的知识约简算法奠定了基础.  相似文献   

16.
属性约简是机器学习等领域中常用的数据预处理方法。在基于粗糙集理论的属性约简算法中,大多是根据单一的方法来度量属性重要度。为了从多角度对属性达到更为优越的评估效果,首先在已有的模糊邻域粗糙集模型中定义属性依赖度度量,然后根据粒计算理论中知识粒度的概念,在模糊邻域粗糙集模型下提出了模糊邻域粒度度量。由于属性依赖度和知识粒度代表了不同视角的属性评估方法,因此将这两种方法结合起来用于信息系统的属性重要度评估,最后给出一种启发式属性约简算法。实验结果表明,所提出的算法具有较好的属性约简性能。  相似文献   

17.
利用粗糙集理论,从矩阵分析的角度来挖掘决策表蕴含的信息,引入粗糙集信息等价关系的同构映射——等价矩阵,等价矩阵可看作是等价关系在信息表内的知识表达。给出了等价矩阵的求取算法以及等价矩阵意义下的属性重要度和核的概念。设计了基于等价矩阵的决策信息表的最小属性约简算法。从等价矩阵本身相关操作运算来挖掘客观知识之间的关联模式,提出了基于信息等价矩阵的关联规则提取的算法。实例证明提出的算法有效,为进一步研究决策信息系统的规则提取和决策算法提供了可行的计算方法。  相似文献   

18.
邱卫根 《计算机科学》2006,33(9):186-188
粗集理论为从信息论角度研究知识粗糙熵和属性约简问题提供了一种重要的途径和方法。本文提出了基于容差关系下的不完备信息系统加权的知识熵和条件熵概念,将等价关系下的粗糙熵自然地推广到不完备信息系统的容差关系情形。本文的结果为在一般二元关系下的知识获取提供了理论依据。  相似文献   

19.
不完备模糊目标信息系统粗集模型与知识约简   总被引:15,自引:0,他引:15  
在不完备信息系统和模糊目标信息系统的基础上,将不完备近似空间和模糊目标信息系统有机地结台起来,提出了不完备模糊目标信息系统的概念;同时还给出了不完备模糊目标信息系统的粗糙集模型,该模型是完备模糊目标信息系统和经典目标信息系统粗糙集模型的推广。还给出了系统知识约简的一些相关概念及其辨识矩阵的知识约简方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号