共查询到17条相似文献,搜索用时 62 毫秒
1.
结合模糊聚类的类内紧致性和类间分离性信息,提出一种新的模糊聚类有效性指标。该指标能够确定由模糊C-均值算法(FCM)所得模糊划分的最优划分和最佳聚类数。在1个人造数据集和4个真实数据集上进行对比实验,结果表明该指标性能的优越性。 相似文献
2.
模糊聚类是模式识别、机器学习和图像处理等领域的重要研究内容。模糊C-均值聚类算法是最常用的模糊聚类实现算法,该算法需要预先给定聚类数才能对数据集进行聚类。提出了一种新的聚类有效性指标,对聚类结果进行有效性验证。该指标从划分熵、隶属度、几何结构角度,定义了紧凑度、分离度、重叠度三个重要特征测量。在此基础上,提出了一种最佳聚类数确定方法。将新聚类有效性指标和传统有效性指标在6个人工数据集和3个真实数据集进行实验验证。实验结果表明,所提出的指标和方法能够有效地对聚类结果进行评估,适合确定样本的最佳聚类数。 相似文献
3.
《微型机与应用》2015,(8)
针对模糊C均值(FCM)算法聚类数需要预先设定的问题,提出了一种新的模糊聚类有效性指标。首先,计算簇中每个属性的方差,给方差较小的属性赋予较大的权值,给方差较大的属性赋予较小的权值,得到一种基于属性加权的FCM算法;然后,根据FCM改进算法得到的隶属度矩阵计算类内紧致性和类间分离性;最后,利用类内紧致性和类间分离性定义一个新的聚类有效性指标。实验结果表明,该指标可以找到符合数据自然分布的类的数目。基于属性加权的FCM算法可以识别不同属性的重要程度,增加聚类结果的准确率,使用FCM改进算法得到的隶属度矩阵定义的有效性指标,能够发现正确的聚类个数,实现聚类无监督的学习过程。 相似文献
4.
聚类有效性指标既可用来评价聚类结果的有效性,也可以用来确定最佳聚类数。根据模糊聚类的基本特性,提出了一种新的模糊聚类有效性指标。该指标结合了数据集的分布特征和数据隶属度两个重要因素来评价聚类结果,提高了判别的准确性。实验证明,该指标能对模糊聚类结果进行正确的评价,并自动获得最佳聚类数,特别是对类间有交叠的情况能够做出准确判定。 相似文献
5.
聚类有效性指标用于评价聚类结果的有效性。根据聚类的基本特性,提出了一个新的用于发现最优模糊划分的聚类有效性指标,该有效性指标采用模糊划分测度和信息熵两个重要因子来评价模糊聚类的有效性。其中,模糊划分测度用于评价聚类的类内紧致性与类间分离性,而信息熵则反映了模糊聚类划分结果的不确定性程度。实验结果表明,该聚类有效性指标能对模糊聚类结果的有效性进行正确的评价,特别是对于空间数据的聚类有效性评价,同其他有效性指标相比,它不仅能得到最优的模糊划分,而且对权重系数也是不敏感的。 相似文献
6.
模糊聚类有效性指标主要是为了解决模糊C-均值算法需要事先给定最佳聚类数的缺陷,但是现有的大多数模糊聚类有效性指标一般过于依赖聚类质心,使得这类指标在含有紧邻类与大小、密度差异大的数据集上无法准确地判断最佳聚类数。为了缓解这个问题,提出了新聚类有效性指标WS。WS指标在一定程度上考虑了最大最小隶属度法则与模糊集偏差,从而全面展示了数据集的整体信息。在人工与真实数据集上,评估WS指标与现有一些指标的有效性,新指标展现出了较高的准确性。在不同的模糊度下,WS有效性指标表现出了较好的鲁棒性。 相似文献
7.
模糊C-均值(FCM)聚类算法是目前最流行的数据集模糊划分方法之一.但是,有关聚类类别数的合理选择和确定,即聚类有效性分析,对FCM算法而言仍是一个开放性问题.为此,本文结合数据集的几何结构信息和FCM算法的模糊划分信息,重新定义了划分矩阵,进而利用划分模糊度提出了一种新的模糊聚类有效性函数.实验结果表明该方法是有效的且具有良好的鲁棒性. 相似文献
8.
一种基于模糊度的聚类有效性函数 总被引:3,自引:0,他引:3
根据模糊集理论,结合模糊C-均值聚类算法的约束条件,提出聚类模糊集概念,定义聚类模糊度.通过深入分析聚类模糊集的模糊度和贴近度在聚类评价中的作用,设计出一种模糊聚类有效性函数,并给出应用该函数实现模糊C-均值聚类有效性判定的具体步骤.实验结果表明,本文提出的聚类有效性函数是合理的. 相似文献
9.
欧卫华 《计算技术与自动化》2009,28(4):115-118
提出用重叠度来刻画模糊类间的距离,在此基础上针对模糊划分总重叠度有随类数增加而单调递增的趋势,提出基于重叠度增量的聚类有效性函数。该算法由重叠度增量最大值来确定最佳聚类数,不但克服了传统有效性函数的单调问题,而且计算简单。基于模糊C-均值聚类算法(FCM),应用多组测试数据对其进行性能分析,并与当前广泛应用且具代表性的有效性函数进行深入比较。仿真结果表明,该函数的有效性和优越性。 相似文献
10.
刘小芳 《计算机工程与应用》2006,42(15):20-22,55
模糊C-均值(FCM)算法是一种非监督的模式识别方法。由于该算法具有对数据集进行等划分的趋势,影响其聚类精度。利用数据点的密度大小作为权值,借助数据本身的分布特性,提出了一种点密度加权模糊C-均值算法。该方法不仅在一定程度上克服了FCM算法的缺陷,而且具有良好的收敛性。当以聚类已知的少量数据点作为监督信息指导聚类,聚类效果进一步改善。并用聚类有效性函数对算法的聚类有效性进行了评价,从而为算法的聚类性能提供了理论依据。 相似文献
11.
针对模糊C-均值的现有评价指标没有涉及到数据集的真实几何分布结构和先验信息的问题,为了能准确找到与数据样本自然分布相匹配的簇,提出了一种改进的有效性评价指标VCSC。该指标结合簇内数据平方误差和、隶属度权值及根号权值定义紧凑性度量,结合簇中心距离最小值、隶属度及各簇中心到平均簇中心的距离和定义分离度,结合隶属度范围及样本分布情况定义结合度量。实验结果表明,所提出的指标能够有效地对聚类结果进行评估,能够准确得出数据中最佳的聚类数目。 相似文献
12.
模糊C均值( FCM)聚类算法最终形成的聚类质量会受到初始值的设定、簇的个数选定及参数选择等多方面因素的影响。文中对最近发表的5种代表性聚类有效性指数在不同的数据维数、聚类个数和参数等条件下对FCM的聚类有效性评价结果进行对比分析。实验结果表明基于类内紧致度和类间离散度比值的聚类有效性指数对数据维度及噪声较为鲁棒,基于隶属度的聚类有效性指数不适于高维数据等,上述结果可帮助研究人员在不同的应用环境下选择合适的模糊聚类有效性函数。 相似文献
13.
对于团状、每类样本数相差较大的数据集,FCM算法和半监督模糊C均值聚类算法都不是最佳聚类方法,因为它们对数据集有等划分趋势。针对这种情况,利用样本点分布密度大小作为权值,结合半监督学习方法,提出半监督点密度加权模糊C均值聚类算法。在半监督学习过程中,对于求极值的问题采用模拟退火算法。结果证明,点密度加权模糊C均值聚类算法确实能提高聚类精度。 相似文献
14.
基于有效性测度的基因表达数据的模糊聚类分析 总被引:1,自引:0,他引:1
本文讨论了模糊聚类中的模糊C均值算法和聚类有效性测度。结合基因微阵列的特点,设计并实现了一种基于聚类有效性函数的模糊C均值模型。将该种模型运用于公开的白血病基因表达数据,取得了与实际情况相吻合的实验结果。 相似文献
15.
16.
Classical clustering methods, such as partitioning and hierarchical clustering algorithms, often fail to deliver satisfactory results, given clusters of arbitrary shapes. Motivated by a clustering validity index based on inter-cluster and intra-cluster density, we propose that the clustering validity index be used not only globally to find optimal partitions of input data, but also locally to determine which two neighboring clusters are to be merged in a hierarchical clustering of Self-Organizing Map (SOM). A new two-level SOM-based clustering algorithm using the clustering validity index is also proposed. Experimental results on synthetic and real data sets demonstrate that the proposed clustering algorithm is able to cluster data in a better way than classical clustering algorithms on an SOM. 相似文献
17.
模糊聚类有效性的研究进展 总被引:2,自引:1,他引:1
聚类有效性评价对聚类分析具有重要意义,是聚类分析的瓶颈之一。本文从基于数据集模糊划分的方法和基于数据集几何结构的方法两方面,归纳综述了常用的模糊聚类有效性评价函数,并讨论了模糊聚类最佳类别数的自动确定问题。 相似文献