首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 62 毫秒
1.
通过引入上、下近似的思想,粗糙K-means已成为一种处理聚类边界模糊问题的有效算法,粗糙模糊K-means、模糊粗糙K-means等作为粗糙K-means的衍生算法,进一步对聚类边界对象的不确定性进行了细化描述,改善了聚类的效果。然而,这些算法在中心均值迭代计算时没有充分考虑各簇的数据对象与均值中心的距离、邻近范围的数据分布疏密程度等因素对聚类精度的影响。针对这一问题提出了一种局部密度自适应度量的方法来描述簇内数据对象的空间特征,给出了一种基于局部密度自适应度量的粗糙K-means聚类算法,并通过实例计算分析验证了算法的有效性。  相似文献   

2.
粗糙K-means聚类算法是一种有效的处理聚类边界模糊问题的算法,但大多数算法对簇的下近似集和边界中的对象使用统一的权值,忽略了簇内对象之间的差异性。针对这一问题提出一种新的改进算法,通过对簇内的每个对象加入簇内不平衡度量,以区分不同对象对簇的贡献程度,使得聚类结果簇内更紧凑、簇间更疏远。不同数据集的仿真实验结果表明,所提出算法可以有效提高聚类结果的精度。  相似文献   

3.
针对粗糙K-means聚类及其相关衍生算法需要提前人为给定聚类数目、随机选取初始类簇中心导致类簇交叉区域的数据划分准确率偏低等问题,文中提出基于混合度量与类簇自适应调整的粗糙模糊K-means聚类算法.在计算边界区域的数据对象归属于不同类簇的隶属程度时,综合考虑局部密度和距离的混合度量,并采用自适应调整类簇数目的策略,获得最佳聚类数目.选取数据对象稠密区域中距离最小的两个样本的中点作为初始类簇中心,将附近局部密度高于平均密度的对象划分至该簇后再选取剩余的初始类簇中心,使初始类簇中心的选取更合理.在人工数据集和UCI标准数据集上的实验表明,文中算法在处理类簇交叠严重的球簇状数据集时,具有自适应性,聚类精度较优.  相似文献   

4.
粗糙K-means算法中下近似和边界区域权重系数的设置对算法的聚类效果有着重要的影响。传统的粗糙K-means算法及很多改进的粗糙K-means算法对所有类簇的下近似和边界区域设置固定的权重,忽视了簇内数据对象分布差异性的影响。针对这个问题,根据下近似和边界区域的数据对象相对于类簇中心的空间分布情况,提出一种新的基于空间距离自适应权重度量的粗糙K-means算法。该算法在每次迭代过程中,根据每个类簇的下近似和边界区域的数据对象相对于类簇中心的平均距离,综合度量下近似和边界区域对于类簇中心迭代计算的不同重要程度,动态地计算下近似和边界区域的相对权重系数。通过实例验证及实验仿真证明了所提算法的有效性。  相似文献   

5.
马福民  逯瑞强  张腾飞 《控制与决策》2017,32(11):1949-1956
如何对交叉边界区域的数据对象进行度量与处理一直是粗糙k-means(RKM)及其衍生算法的主要出发点.uppiRKM算法通过引入Laplace无差别原则,较好地解决了传统RKM算法对权重系数的选择比较敏感等相关问题,但没有考虑边界区域多个类簇的交叉程度以及边界区域数据对象的空间位置分布对聚类结果的影响.鉴于此,设计一种对边界区域的数据对象进行局部模糊度量的方法,并提出基于边界区域局部模糊增强的uppiRKM聚类改进算法,通过多组实例分析验证了所提出算法的有效性.  相似文献   

6.
提取区间型数据的特征值,给出适用于区间型数据模糊聚类的FCM算法族(IFCM)。该算法适用于不同特征样本数据的模糊聚类运算,并可对聚类结果进行优化。聚类效果的仿真比较表明,IFCM聚类的平均失真度比基于欧氏距离的FCM聚类算法低6.81%。由于距离定义的合理性,IFCM可以根据区间型数据的不同特点调整特征值的聚类权重,并推广至多维类型数据的模糊聚类。  相似文献   

7.
在分析归纳原有聚类方法不足的基础上,结合粗糙理论和模糊理论,给出了改进的粗糙模糊K-均值聚类算法;设计了新的模糊粗糙K-均值聚类算法,并验证了该聚类算法的有效性;进而将这两种聚类算法应用到支持向量机中,对训练样本做预处理,以减少样本数目,提高了其训练速度和分类精度。  相似文献   

8.
粗糙的方向性模糊聚类算法   总被引:1,自引:0,他引:1       下载免费PDF全文
根据高维数据具有方向性的特征,结合概率模糊聚类算法与粗糙集理论提出了一种粗糙的方向性模糊聚类算法。该算法在概率模糊聚类算法中引入了数据方向相似性函数,能对不确定数据进行处理。在算法中利用粗糙集中的下近似集与边界集来确定目标对象函数,属于下近似集的数据在聚类时是确定的,属于边界的数据具有模糊性。实验结果表明,该算法能有效地对高维的方向性数据进行聚类。  相似文献   

9.
相似性度量是聚类分析的重要基础,如何有效衡量类属型符号间的相似性是相似性度量的一个难点.文中根据离散符号的核概率密度衡量符号间的相似性,与传统的简单符号匹配及符号频度估计方法不同,该相似性度量在核函数带宽的作用下,不再依赖同一属性上符号间独立性假设.随后建立类属型数据的贝叶斯聚类模型,定义基于似然的类属型对象-簇间相似性度量,给出基于模型的聚类算法.采用留一估计和最大似然估计,提出3种求解方法在聚类过程中动态确定最优的核带宽.实验表明,相比使用特征加权或简单匹配距离的聚类算法,文中算法可以获得更高的聚类精度,估计的核函数带宽在重要特征识别等应用中具有实际意义.  相似文献   

10.
针对区间数模糊c均值聚类算法存在模糊度指数m无法准确描述数据簇划分情况的问题,对点数据集合的区间Ⅱ型模糊c均值聚类算法进行拓展,将其扩展到区间型不确定数据的聚类中。同时,分析了区间数的区间Ⅱ型模糊c均值聚类算法的收敛性,以确定模糊度指数m1和m2的取值原则。基于合成数据和实测数据的仿真实验结果表明:区间数的区间Ⅱ型模糊c均值聚类算法比区间数的模糊c均值聚类算法的聚类效果好。  相似文献   

11.
随着II-型模糊集理论的不断发展和应用领域的扩大,需要探讨II-型模糊集不确定性的性质与度量方法,在研究II-型模糊集不确定性特征及模糊熵的基础上,通过扩展模糊熵的定义,给出了离散II-型模糊集熵的定义,证明其满足模糊熵的4条公理性条件,该定义将对II-型模糊集在不确定环境中的应用提供新的思路和方法。  相似文献   

12.
基于自适应权重的粗糙K均值聚类算法   总被引:2,自引:0,他引:2  
原有Rough K-means算法中类的上、下近似采用固定经验权重,其科学性值得商榷,针对这一问题,设计了一种基于自适应权重的粗糙K均值聚类算法。基于自适应权重的粗糙聚类算法在每一次迭代过程中,根据当前的数据划分状态,动态计算每个样本对于类的权重,降低了原有算法对初始权重的依赖。此外,该算法采用近似集合中的高斯距离比例来表现样本权重,从而可以在多种数据分布上得到更精确的聚类结果。实验结果表明,基于自适应权重的粗糙K均值算法是一种较优的聚类算法。  相似文献   

13.
基于密度加权的粗糙K-均值聚类改进算法   总被引:7,自引:1,他引:7  
针对粗糙K-均值聚类算法中类均值计算式的特点,提出了一种改进的粗糙K-均值算法.改进后的算法基于数据对象所在区域的密度,在类的均值计算过程中对每个对象赋以不同的权重.不同测试数据集的实验结果表明,改进后的粗糙K-均值算法提高了聚类的准确性,降低了迭代次数,并且可以有效地减小孤立点对聚类的影响.  相似文献   

14.
属性约简是粗糙集理论的重要应用之一,其目的是在保持分类能力不变的前提下去掉冗余的属性,从而简化信息系统。由于经典粗糙集等价关系的要求过于严格,为了更好地解决实际问题,将粗糙集与二型模糊集结合,得到二型模糊粗糙集。利用论域和特征空间的积空间上的两个一型模糊集来构造论域的一个二型模糊划分,将模糊粗糙集属性约简的模型推广到二型模糊粗糙集框架中,得到了一个二型模糊粗糙属性约简的模型,并举例说明了用此模型进行属性约简的方法。  相似文献   

15.
Nowadays, in the social network–based decision-making processes, like the ones involved in e-commerce and e-democracy, multiple users with different backgrounds may take part and diverse alternatives might be involved. This diversity enriches the process, but at the same time, increases the uncertainty of opinions. This uncertainty can be considered from two different perspectives: (i) the uncertainty in the meaning of the words given as preferences, that is, motivated by the heterogeneity of the decision makers; and (ii) the uncertainty inherent to any decision-making process that may lead to an expert not being able to provide all their judgments. The main objective of this study is to address these two types of uncertainty. To do so, the following approaches are proposed: First, to capture, process, and keep the uncertainty in the meaning of the linguistic assumption, the Interval Type-2 Fuzzy Sets are introduced as a way to model the experts' linguistic judgments. Second, a measure of the coherence of the information provided by each decision maker is proposed. Finally, a consistency-based completion approach is introduced to deal with the uncertainty presented in the expert judgments. The proposed approach is tested in an e-democracy decision-making scenario.  相似文献   

16.
Pixel clustering in spectral domain is an important approach for the soft-tissue categorization of magnetic resonance (MR) brain images. In this regard, clustering algorithms based on type-1 fuzzy set theory are suitable for the overlapping partitions while the rough set based clustering algorithms deal with uncertainty and vagueness. However, additional degree of fuzziness makes the clustering more challenging for various subtle uncertainties and noisy data in the overlapping areas. Hence, this fact motivates us to propose a hybrid technique, called Rough Possibilistic Type-2 Fuzzy C-Means clustering with the integration of Random Forest. In the proposed method, possibilistic approach handles the noisy data better, whereas the other various uncertainties and inherent vagueness are taken care by type-2 fuzzy set and rough set theories. After clustering, it produces rough and crisp points. Thereafter, such crisp points are used to train the Random Forest classifier in order to classify the rough points for yielding better clustering solution. The performance of the proposed method has been demonstrated in comparison with several other recently proposed methods for MR brain image segmentation. Finally, superiority of the results produced by the proposed hybrid method has also been validated through statistical significance test.  相似文献   

17.
赵涛  肖建 《自动化学报》2013,39(10):1714-1721
基于区间二型模糊包含度的公理化定义,给出了新的区间二型模糊包含度计算公式.进一步,通过包含度定义了区间二型模糊粗糙集,并讨论了它的一些基本性质.最后,利用区间二型模糊粗糙集研究了连续域决策信息系统的属性约简,给出了新的约简方法.实例说明了该约简方法的具体计算步骤,并且通过实验验证了该算法的有效性和可行性.  相似文献   

18.
当前大多数的聚类方法是针对单一属性类型的。要开发出能同时处理多种属性类型的聚类方法来适应当今大型的复杂数据库,这在现实应用中是至关重要的。本文提出了基于粗集和粒度思想的多属性类型的聚类算法。该算法能够满足同时处理混合属性的要求.以达到聚类的目的。此外,文中也通过一个具体实例来演示算法的可行性和有效性。结果表明,基于粗集和粒度思想的多属性类型的聚类算法简单有效、易于操作.而且能够清晰方便地对粒度结果进行分析。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号