首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 765 毫秒
1.
以基于邻域系统的粗糙集模型为基础,给出了邻域系统分层递阶结构的5条公理;提出了一种序关系,用来描述不同邻域系统之间的粗细关系;证明了新提出的这种序关系满足邻域系统分层递阶结构的公理化形式。  相似文献   

2.
粗糙集的不确定性度量在知识获取中扮演着非常重要的角色。在邻域粗糙集理论中,当前不确定性度量方面的研究工作主要专注于度量单个知识空间的不确定性及其随粒度变化的单调性规律,其仍存在以下缺点:1)邻域粗糙集不确定性来自于邻域粒中属于目标概念的元素和不属于目标概念的元素,当前的方法没有同时考虑每个邻域信息粒的这两部分;2)不能反映不同知识空间对目标概念刻画能力的差异性;3)由于当前的知识距离包含了粒度划分的信息,已有方法在一些应用场合下不够准确,例如属性约简中的知识启发式搜索及其粒度选择。对此,文中首先构建了一种更加直观准确的邻域粗糙集的不确定性度量方法——邻域熵,并证明了不确定性度量随着粒度的细化具有单调性;为了反映不同邻域信息粒对目标概念刻画能力的差异性,提出了一种带近似描述能力的邻域粒距离,称为相对邻域粒距离,并介绍了它的相关性质;针对分层递阶的多粒度知识空间中的粒度选择问题,建立了基于边界域的邻域知识距离度量模型,该知识距离可以反映不同邻域知识空间对目标概念的刻画能力的差异性。  相似文献   

3.
邻域系统粗糙集和覆盖粗糙集是经典粗糙集的两种重要扩展。通过分别比较各模型中下(上)近似集之间的包含关系和近似精度之间的大小关系,深入探讨邻域系统粗糙集和6种覆盖粗糙集模型之间的关系,得出了邻域系统粗糙集和6种覆盖粗糙集模型的下(或上)近似集之间的关系是明确的,其要么是可以比较的,要么是不可以比较的,证明了可比较的具有包含甚至等价关系,不可比较的通过反例进行了佐证。对不同扩展粗糙集的对比研究加深了对这些模型的理解,同时也为宏观上学习和认识粗糙集提供了帮助。  相似文献   

4.
姚晟  徐风  吴照玉  陈菊  汪杰  王维 《控制与决策》2019,34(2):353-361
属性约简是粗糙集理论一项重要的应用,目前已广泛运用于机器学习和数据挖掘等领域,邻域粗糙集是粗糙集理论中处理连续型数据的一种重要方法.针对目前邻域粗糙集模型中属性约简存在的缺陷,构造一种基于邻域粗糙集的邻域粗糙熵模型,并基于此给出邻域粗糙联合熵、邻域粗糙条件熵和邻域粗糙互信息熵等概念.邻域粗糙互信息熵是评估属性集相关性的一种重要的方法,具有非单调性变化的特性,对此,提出一种基于邻域粗糙互信息熵的非单调性属性约简算法.实验分析表明,所提出算法不仅比目前已有的单调性属性约简算法具有更优越的属性约简结果,而且具有更高的约简效率.  相似文献   

5.
邻域多粒度粗糙集模型是粗糙集理论的重要研究分支。然而在大数据环境下,数据时刻处于动态更新之中,针对数值型信息系统对象动态变化的情形,本文提出一种邻域多粒度粗糙集模型的增量式更新算法。文中首先利用矩阵的方法表示了邻域多粒度粗糙集中邻域类与目标近似集之间的两种近似关系,分别称之为子集近似关系矩阵和交集近似关系矩阵,并通过这两种近似关系矩阵重构了邻域多粒度粗糙集模型;然后针对数值型信息系统对象增加和对象减少的情形,研究了这两种近似关系矩阵随对象变化时的增量式更新,理论分析证明了这种更新方法的高效性;最后基于近似关系矩阵的增量式更新设计出了邻域多粒度粗糙集模型的增量式更新算法。实验结果验证了所提出增量式算法的有效性和优越性。  相似文献   

6.
传统单一阈值的邻域粗糙集不能有效降低信息的不确定性。考虑对象已有或预测的类别标签信息,通过引入类内和类间两种阈值,提出一种新的邻域粒化方法,并构建了一种基于监督邻域的粗糙集模型。该模型是传统邻域粗糙集的推广形式。通过分析双阈值下的邻域粒子变化规律,给出该模型的粗糙近似质量和条件熵单调性变化定理。最后通过4个UCI数据集验证了该模型的性能。实验结果显示,可以通过调节监督阈值参数来改善论域的邻域粒化效果,并降低信息的不确定性。  相似文献   

7.
《计算机科学与探索》2016,(12):1793-1800
针对传统粗糙集理论中不确定度量方法难以适用于邻域粗糙集模型的问题,引入信息熵的度量方法,提出了基于信息熵的邻域粗糙集不确定性度量方法。该方法采用邻域关系对连续型数据进行信息粒化,基于粒化后的数据定义邻域系统中的近似精度、邻域信息熵、加权邻域信息熵等不确定性度量。进一步提出邻域系统不确定性度量的公理化表示,证明邻域系统的近似精度、邻域信息熵、加权邻域信息熵都是公理化度量;给出其最大最小值,证明其满足单调性原理。理论分析与实验表明邻域系统中的信息熵度量优于近似精度度量。  相似文献   

8.
多粒度决策理论粗糙集是多粒度视角下三支决策中一种重要的模型。在数值型不完备数据下建立邻域容差关系;在其基础上提出乐观和悲观的邻域多粒度决策理论粗糙集模型。为了弥补这两种模型的局限,提出平均邻域多粒度决策理论粗糙集模型,并分析相关性质以及相互关系。同时为了使所提出的邻域多粒度决策理论粗糙集适用于不完备数据环境,运用区间值的形式表示代价函数,并通过选取不同参数的方式提出一种可变三支决策。实例分析表明,该模型与方法具有一定的合理性与灵活性。  相似文献   

9.
目前,邻域多粒度粗糙集模型广泛采用的距离函数闵可夫斯基距离存在着一定的局限性,通过引入兰氏距离作为距离函数,重构了邻域半径的选取方法,基于此提出一种改进的邻域多粒度粗糙集模型,并证明了相关的性质。采用UCI标准库数据集进行实验分析,对比两种模型的实验结果,验证了改进邻域多粒度粗糙集模型在近似逼近方面的优越性。  相似文献   

10.
数值型不完备信息系统的特征选择方法大多是以容差关系为基础,但是这种处理方式存在数据相似性刻画过于宽松的缺陷.文中提出邻域量化容差关系的粗糙集模型,在该模型的基础上定义邻域量化容差条件熵,分析相关性质,根据邻域量化容差条件熵的单调性构造相应的特征选择算法.实验表明,文中算法在特征选择结果、运行时间和分类精度方面具有优越性.  相似文献   

11.
用同态的概念作为处理部域信息系统中数据压缩的工具。给出了部域信息系统和诱导的部域信息系统概 念,并在此基础上定义了一种新的协调函数,研究了在同态映射下部域信息系统的一些重要性质,证明了原部域信息 系统与同态象部域信息系统约简的等价性,从而得到一种通过计算数据量较少的象信息系统的约简来对原系统进行 数据压缩的方法.  相似文献   

12.
集值信息系统是完备信息系统的广义形式,其中的一些对象在某些属性下的取值可能不止一个,反映的是信息的不确定性。在集值信息系统上引入对象的邻域关系,并以每个对象的邻域作为基本集,建立了集值信息系统的粗糙集方法。为了简化知识的表示,进一步在集值信息系统上提出了邻域协调集与邻域约简的概念,并讨论了这种邻域协调集的性质与判定。最后通过区分函数得到了计算集值信息系统邻域约简的方法。  相似文献   

13.
Rough set reduction has been used as an important preprocessing tool for pattern recognition, machine learning and data mining. As the classical Pawlak rough sets can just be used to evaluate categorical features, a neighborhood rough set model is introduced to deal with numerical data sets. Three-way decision theory proposed by Yao comes from Pawlak rough sets and probability rough sets for trading off different types of classification error in order to obtain a minimum cost ternary classifier. In this paper, we discuss reduction questions based on three-way decisions and neighborhood rough sets. First, the three-way decision reducts of positive region preservation, boundary region preservation and negative region preservation are introduced into the neighborhood rough set model. Second, three condition entropy measures are constructed based on three-way decision regions by considering variants of neighborhood classes. The monotonic principles of entropy measures are proved, from which we can obtain the heuristic reduction algorithms in neighborhood systems. Finally, the experimental results show that the three-way decision reduction approaches are effective feature selection techniques for addressing numerical data sets.  相似文献   

14.
罗豪  续欣莹  谢珺  张扩  谢新林 《计算机应用》2016,36(11):2958-2962
针对当前的邻域粗糙集多用于处理完备的信息系统,而非不完备的信息系统这一问题,提出了一种可用于处理不完备混合信息系统的扩展容差关系,并给出相关定义,使用容差完备度和邻域阈值作为限制条件计算扩展容差邻域,以此邻域为基础选择决策正域得到系统的属性重要性,并以该重要性作为启发因子给出基于扩展容差关系的属性约简算法。采用UCI数据集中的7组不同类型的数据集进行仿真实验,并分别与扩展邻域关系(EN)、容差邻域熵(TRE)、邻域粗糙集(NR)的方法进行比较,实验结果表明,该方法在保证分类精度的同时能够约简得到更少的属性。最后讨论了在扩展容差关系中改变邻域阈值对分类精度产生的影响。  相似文献   

15.
Multi-label learning deals with data associated with a set of labels simultaneously. Like traditional single-label learning, the high-dimensionality of data is a stumbling block for multi-label learning. In this paper, we first introduce the margin of instance to granulate all instances under different labels, and three different concepts of neighborhood are defined based on different cognitive viewpoints. Based on this, we generalize neighborhood information entropy to fit multi-label learning and propose three new measures of neighborhood mutual information. It is shown that these new measures are a natural extension from single-label learning to multi-label learning. Then, we present an optimization objective function to evaluate the quality of the candidate features, which can be solved by approximating the multi-label neighborhood mutual information. Finally, extensive experiments conducted on publicly available data sets verify the effectiveness of the proposed algorithm by comparing it with state-of-the-art methods.  相似文献   

16.
Y.Y. Yao 《Information Sciences》2006,176(23):3431-3452
An approximate retrieval model is proposed based on the notion of neighborhood systems. The knowledge used in the model consists of an information table, in which each object is represented by its values on a finite set of attributes, and neighborhood systems on attribute values, which provide semantic similarity or closeness of different values. An information table can be used for exact retrieval. With the introduction of neighborhood systems to information tables, one is able to perform approximate retrieval. Operations on neighborhood systems are introduced based on power algebras. An ordering relation representing the information of a neighborhood system is suggested and examined. Approximate retrieval is carried out by the relaxation of the original query using neighborhood systems, and the combination of intermediate results using neighborhood system operations. The final retrieval results are presented according to the proposed ordering relation. In contrast to many existing systems, a main advantage of the proposed model is that the retrieval results are a non-linear ordering of objects.  相似文献   

17.
针对名义型属性和数值型属性并存的混合型数据,结合多粒度邻域粗糙集和直觉模糊集,分别定义模糊覆盖粗糙隶属度和非隶属度.基于不同的属性集序列和不同的邻域半径,构建多粒度邻域粗糙直觉模糊集模型,证明模型相关性质.然后提出乐观和悲观多粒度邻域粗糙直觉模糊集的近似集,并讨论模型性质.最后使用文中模型计算实例,说明其能较好地解决名义型属性和数值型属性的混合型数据的处理问题.  相似文献   

18.
多尺度决策信息系统的特征子集选择是处理多尺度分类问题的一种有效的数据预处理方法.在实际应用中,数据类型往往多样混合,现有的多尺度模型无法有效处理这类数据.针对该问题,文中面向多源异构多尺度数据,提出多尺度邻域半径的形式化定义,构造多尺度邻域信息粒并讨论其相关性质.在此基础上,探讨特征的重要度,提出可同步进行最优尺度选择和特征选择的特征子集选择算法.改进原有的Wu-Leung模型,在一定程度上扩展其在实际问题上应用的范围.最后,在UCI数据集上验证模型和算法的可行性和有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号