首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
基于粒度计算的数据分类建模研究*   总被引:1,自引:1,他引:0  
基于粒度计算在理论上对数据分类问题进行建模研究.引入全粒度空间的概念,给出了集合的粒度表示、概念学习在粒度计算理论中的解释,从而得到数据分类问题的机理分析;最后导出了基于数据分类的知识发现模型,为知识发现面临的问题提供解决的理论依据,也为进一步研究奠定了重要的理论基础.  相似文献   

2.
粒度计算理论为知识发现的研究提供了新的理论工具,通过引入全粒度空间的概念,对信息系统的论域空间进行等价划分,给出了论域子空间可精确粒度表示的充分条件,建立了目标概念的外延和内涵的粒度计算关系,揭示了目标概念学习中的粒度计算过程,提出了一种新的数据分类模型。  相似文献   

3.
利用粒度计算有关理论,建立信息系统的知识粒度空间-全粒度空间和超粒度空间,找到了定义于超粒度空间之上的格和布尔代数,并利用格的有关性质导出了全粒度空间的结构模型-超树,得到了全粒度空间和超树的若干性质,为KDD算法的具体设计与实现提供了指导信息,为进一步研究知识发现机理等问题奠定了理论基础,丰富和完善了KDD的几何和代数理论体系.  相似文献   

4.
基于粒度计算的覆盖算法   总被引:1,自引:0,他引:1  
赵姝  张燕  平张铃 《计算机科学》2008,35(3):225-227
为了更好地解决高维海量数据的分类问题,本文提出一种基于粒度计算的覆盖算法.该算法以粒度计算为理论依据,指出在分析研究某一问题时,可以适当将其属性、论域或者结构粗化,求得某个商空间,在该商空间中抓住事物的本质对其研究,对某些在同一个粗粒度世界无法识别或者彼此特征区别很弱的对象可以换一个粒度世界对其分析,从而全面了解整个问题;以构造性学习算法--覆盖算法为具体实现工具,得到多个商空间中的结果,最终由商空间理论中的函数合成法获得完整结果.实验证明这种基于粒度计算的覆盖算法在解决分类问题时是行之有效的.  相似文献   

5.
给出了全粒度空间的拓扑结构模型,进一步介绍了面向粒度计算的产生式决策逻辑语言GDL-language,然后定义了面向粒度描述的正基语言,阐明该语言公式的语义解释,给出了一种“全粒度空间+正基语言”的粒度计算模型,并找到了正基语言系统、粒度空间和基本概念空间的关系定理。最后,把KDD任务归结为基于该模型的粒度计算问题,这样就可以把各种KDD任务统一到一个理论框架下,也便于比较和研究。这些工作无疑对令后知识发现的研究起着重要的作用.  相似文献   

6.
7.
基于商空间粒度计算的SAR图像分类   总被引:3,自引:0,他引:3  
SAR图像的分类是实现SAR图像自动理解与解译的图像的分类提供了大量有用的信息,尤其对于单波段、单极化的SAR图像,纹理信息就显得格外重要.然而,不同纹理特征对SAR图像中不同地表结构内在属性的刻画能力并不一致.如何将不同纹理特征结合起来,以获得应用范围更广且分类效果更好的SAR图像分类方法,是当前SAR图像处理研究中的一个热点问题.文章将商空间粒度计算引入SAR图像的分类中,结合SAR图像特性,提出了一种基于粒度合成理论的SAR图像分类方法.该方法首先利用具有良好推广能力的支撑矢量机基于不同纹理特征获得SAR图像的不同分类结果,并认为这些分类结果构成不同的商空间,再根据粒度合成理论将这些商空间组织起来得到SAR图像的最终分类结果.实验结果验证了这种方法的有效性和正确性以及商空间的粒度计算在SAR图像分析中的应用潜力.  相似文献   

8.
以空间遥感数据为研究对象,研究多粒度标记数据的分类问题。首先,根据地表物的不同物理含义,可以得到一个多粒度的决策表。然后,通过知识约简发现隐藏在多粒度决策表中的if-then分类规则。最后,根据实际的遥感数据给出分类的精度。  相似文献   

9.
基于商空间粒度理论的大规模SVM分类算法   总被引:4,自引:1,他引:3  
利用商空间粒度理论对已有的SVM分类算法进行改进,给出了一种新的SVM分类算法——SVMG。该算法将SVM分类问题划分成两个或多个子问题,从而降低了SVM分类复杂度。实验表明,改进的算法适用于处理大数据量的样本,能在保持分类精度的情况下有效地提高支持向量机的学习和分类速度。  相似文献   

10.
在图像检索领域应用商空间粒度思想,阐述了图像检索中的粒度原理,对图像检索问题进行商空间描述,并构造等价关系,提出了一种新的图像检索方法.根据图像在不同粒度下的表现构造不同粒度下的商空间,然后根据商空间粒度合成原理构造最优准则函数,对已得到的商空间进行属性合成,进而以合成后的属性函数来完成图像检索.与采用单一属性特征的图像检索方法相比,该方法能够在更大程度上利用图像自身所提供的信息,取得更好的检索效果和更高的查全率查准率指标.  相似文献   

11.
陈小波  吴涛  高正龙 《计算机工程》2012,38(22):167-170
K近邻多标签学习算法的近邻点个数取固定值,而没有考虑样本分布的特点,可能会将相似度高的点排除在近邻集外,或者将相似度低的点包含在近邻集内,影响分类器的性能。为此,将粒计算的思想引入近邻集的构建,提出一种新的K近邻多标签学习算法。通过粒度控制,确定近邻点集,使得领域内的样本点有高相似性,且此类样本能进入近邻集。实验结果表明,该算法的大多数评价指标均优于现有的多标签学习算法。  相似文献   

12.
Data imputation is a common practice encountered when dealing with incomplete data. Irrespectively of the existing spectrum of techniques, the results of imputation are commonly numeric meaning that once the data have been imputed they are not distinguishable from the original data being initially available prior to imputation. In this study, the crux of the proposed approach is to develop a way of representing imputed (missing) entries as information granules and in this manner quantify the quality of the imputation process and the quality of the ensuing data. We establish a two-stage imputation mechanism in which we start with any method of numeric imputation and then form a granular representative of missing value. In this sense, the approach could be regarded as an enhancement of the existing imputation techniques.Proceeding with the detailed imputation schemes, we discuss two ways of imputation. In the first one, imputation is realized for individual variables of data sets and afterwards enhanced by the buildup of information granules. In the second approach, we are concerned with the use of fuzzy clustering, Fuzzy C-Means (FCM), which helps establish a structure in the data and then use this information in the imputation process.The design of information granules invokes the fundamentals of Granular Computing, namely a principle of justifiable granularity and an allocation of information granularity. Numeric experiments concerned with a suite of publicly available data sets offer detailed insights into the main facets of the overall design process and deliver a parametric analysis of the methods.  相似文献   

13.
粒的表示、粒之间的关系和运算是粒计算的主要研究内容。利用向量表示超盒粒, 分析向量之间的偏序关 系和超盒粒之间的偏序关系的不一致性, 并引入保序函数消除该不一致性。利用格和其对偶格之间的非线性正评价函数和保序函数构造超盒粒之间模糊包含关系。为得到不同粒度的粒, 设计超盒粒之间的合并算子和分解算子, 证明由超盒粒集、超盒粒之间的模糊包含关系、合并算子、分解算子构成的代数系统是模糊格, 构造基于模糊格的超盒粒计算分类器。用机器学习数据集中的分类问题, 验证该分类器具有和模糊格推理分类器相同的推广能力并减少超盒粒的数量。  相似文献   

14.
赵海峰  余强  曹俞旦 《计算机科学》2014,41(12):160-163
多标签学习用于处理一个样本同时拥有多个标签的问题。已有的多标签懒惰学习算法IMLLA未充分考虑样本分布的特点,即在构建样本的近邻点集时,近邻点个数取固定值,这可能会将相似度高的点排除在近邻集之外,或者将相似度低的点包括在近邻集内,影响分类方法的性能。针对IMLLA的缺陷,将粒计算的思想加入近邻集的构建,提出一种基于粒计算的多标签懒惰学习算法(GMLLA)。该方法通过粒度控制,确定样本近邻点集,使得近邻集内的样本具有高相似度。实验结果表明,本算法的性能优于IMLLA。  相似文献   

15.
陈光  钟宁  姚一豫  黄佳进 《计算机科学》2011,38(12):209-212
粒计算三元论模型将现有粒计算研究成果的共性抽象出来,为问题求解提供了统一的方法论,而三元论模型是以多层次、多视角的粒结构为基础的。基于图的粒结构首先定义了图上的粒和层次,然后基于半序关系定义了图上的粒结构。在基于图的粒结构基础上,给出了实现不同粒度之间转换的“细化”、“粗化”运算符。“细化”运算处理从粗粒度到细粒度的转换,将粗粒度层次中的粒转换为细粒度层次中的粒,将粗粒度层次转换为细粒度层次。“粗化”运算处理从细粒度到粗粒度的转换,将细粒度层次中的粒转换为粗粒度层次中的粒,将细粒度层次转换为粗粒度层次。通过粒结构和“细化”、“粗化”运算,可以在不同的粒度上分析同一问题并使其在不同粒度之间自由转换。  相似文献   

16.
传统的属性约简方法将整个数据集一次性装入内存,很难适应大数据背景下的数据分析。为此文中提出基于粒计算与区分能力的属性约简算法。该算法运用统计学中的分层抽样技术,拆分原始大数据集为多个样本子集(粒),在每个粒上运用属性的区分能力进行属性约简,最后将各粒约简结果进行加权融合,得到原始大数据集的属性约简结果。实验表明该算法对海量数据集进行属性约简的可行性和高效性。  相似文献   

17.
文章提出应用粒度计算和神经网络覆盖算法对通信信号的调制样式进行识别。采用数字信号处理方法,从已调信号中提取信号关键特征以及它们的统计值作为样本特征集。根据不同调制信号的特点,粗粒度处理训练样本形成新的学习样本并以此构造一个覆盖神经网络。然后利用得到的覆盖领域,进行样本识别。对粗粒度类别样本利用样本的关键属性进行投影区分。通过大量的仿真数据验证,此方法对通信信号样式识别取得了很好的效果。  相似文献   

18.
提出基于粒计算的犹豫模糊多准则决策方法.给出各个准则下对应的犹豫模糊集中犹豫模糊元的大于可能度定义,并构造相应准则下的加性一致的模糊偏好矩阵.根据各准则的模糊偏好矩阵对应的预序熵及预序粒结构相似度确定属性的权重,对各个准则下模糊偏好矩阵的排序向量加权平均得到最终的排序向量.文中方法以评价数据序信息量及准则序与整体之间的关系确定准则权重,通过计算加权两两比较下的排序向量得到最终的排序决策结果.最后运用实例验证算法的有效性及可行性.  相似文献   

19.
本文依据标准粗糙集理论,结合粒计算思想,将基于等价关系的粗糙集模型扩展到偏序关系下,并进一步利用偏序关系的性质构造了不同分类来探讨上、下近似集,构造了基于粒计算的偏序粗集模型。模型在一定程度上扩充了标准粗集理论的应用范围,有利于人们研究生活中具有偏序关系的问题,文章结合信号传播现象阐述了其现实意义。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号