共查询到19条相似文献,搜索用时 156 毫秒
1.
模糊c均值聚类算法是目前聚类分析中最受欢迎的算法之一,但其聚类效果往往受初始参数的影响.针对这一问题,提出一种基于网格和密度的模糊c均值聚类初始化方法.以网格和密度为工具提取聚类样本的类聚类中心,以此来初始化模糊c均值聚类算法的初始参数,从而弥补原算法的不足.实验证明方法是可行的、有效的. 相似文献
2.
3.
针对模糊C均值聚类算法易受初始聚类中心影响且收敛速度慢的缺陷,提出一种基于二次网格优化的粒子群模糊聚类算法Grid-PFcm。该算法首先将数据空间网格化,依据深度优先遍历规则,连通相邻密集网格单元,计算连通网格的相对密度,选取相对密度值最大的连通网格,计算中心位置,初始化聚类中心。然后,按照基于网格空间的单维向量变化原理,实现最佳粒子全局寻优,进一步优化初始聚类中心,以降低初始聚类中心选取对聚类效果的影响度。最后,通过实验表明,该算法能够加快寻优收敛速度,提高聚类效率和效果。 相似文献
4.
基于全局优化搜索算法的图像分割研究 总被引:2,自引:0,他引:2
基于聚类的图像分割算法中,由于模糊C-均值算法需要初始化,并且目标函数存在许多局部极小点,如果初始化落在目标函数的局部极小点附近,就会造成算法收敛到局部极小.为了解决此问题,采用全局优化搜索算法,提出了将全局优化搜索技术引入进来对模糊C-均值算法加以改进,分析了在不同初始条件下,对许多样本的聚类分析时,全局优化搜索算法比传统的模糊C-均值聚类算法更加有效,通过仿真实验验证并对算法性能进行理论分析. 相似文献
5.
6.
结合密度聚类和模糊聚类的特点,提出一种基于密度的模糊代表点聚类算法.首先利用密度对数据点成为候选聚类中心点的可能性进行处理,密度越高的点成为聚类中心点的可能性越大;然后利用模糊方法对聚类中心点进行确定;最后通过合并聚类中心点确定最终的聚类中心.所提出算法具有很好的自适应性,能够处理不同形状的聚类问题,无需提前规定聚类个数,能够自动确定真实存在的聚类中心点,可解释性好.通过结合不同聚类方法的优点,最终实现对数据的有效划分.此外,所提出的算法对于聚类数和初始化、处理不同形状的聚类问题以及应对异常值等方面具有较好的鲁棒性.通过在人工数据集和UCI真实数据集上进行实验,表明所提出算法具有较好的聚类性能和广泛的适用性. 相似文献
7.
为解决当前负荷预测模型中聚类中心随机性大、聚类结果质量差、稳定性差的问题,将传统的模糊c均值聚类和局部密度法结合,提出基于改进模糊c均值聚类中心优化算法的负荷分类方法.首先,对收集得的负荷数据进行归一化处理,利用局部密度公式选择初始聚类中心;接着,对日负荷聚类,以某电网典型负荷作为算例验证该算法.结果表明,该算法有较好... 相似文献
8.
针对区间数模糊c均值聚类算法存在模糊度指数m无法准确描述数据簇划分情况的问题,对点数据集合的区间Ⅱ型模糊c均值聚类算法进行拓展,将其扩展到区间型不确定数据的聚类中。同时,分析了区间数的区间Ⅱ型模糊c均值聚类算法的收敛性,以确定模糊度指数m1和m2的取值原则。基于合成数据和实测数据的仿真实验结果表明:区间数的区间Ⅱ型模糊c均值聚类算法比区间数的模糊c均值聚类算法的聚类效果好。 相似文献
9.
黄力明 《计算机工程与设计》2008,29(9):2300-2303
模糊C-均值聚类算法广泛用于图像分割,但存在聚类性能受类中心初始化影响,且计算量大等问题.为此,提出了一种基于微粒群的模糊C-均值聚类图像分割算法,该方法利用微粒群较强的搜索能力搜索聚类中心:由于搜索聚类中心是按密度进行,计算量小,故可以大幅提高模糊C-均值算法的计算速度.实验结果表明,该方法可以使模糊聚类的速度得到明显提高,实现图像的快速分割. 相似文献
10.
一种特征加权的聚类算法框架 总被引:3,自引:0,他引:3
为了考虑数据各维特征对聚类的不同贡献,并把有监督特征评价方法应用到无监督分类问题中,提出一种特征加权的聚类算法框架.该框架首先通过某种聚类算法对数据聚类,然后,根据聚类结果,采用有监督特征评价方法学习各维特征的权值,再根据特征权值重新聚类,之后再次学习特征权值,该过程反复迭代,直至算法收敛或达到指定的迭代次数.欧几里德空间内基于距离、基于密度的聚类算法均适用于本框架.基于本框架,采用模糊C均值聚类算法(FCM)、密度聚类算法(DBSCAN),并通过信息增益特征评价、ReliefF特征评价方法,对多个UCI数据集进行了实验,验证了该框架的有效性. 相似文献
11.
针对现有模糊聚类方法仅仅是对已有数据点的聚类的不足,提出了在已有数据集的基础上找到新的一类集群的聚类方法 CFCM。该算法在FCM算法的基础上,通过引入观测点P作为聚类的先验知识,来大致确定未知集群的聚类中心,定义了权重系数λ来限定观测点对新的一类聚类中心形成的影响程度。人造数据集和UCI真实数据集的实验结果表明,该算法不仅对已知数据点有较好的聚类效果,并且可以在观测点P的作用下在特定区域创造出新的一类无已知数据点的集群中心点的大致位置,因而在实际中有潜在应用价值。 相似文献
12.
13.
14.
15.
Generalized weighted conditional fuzzy clustering 总被引:2,自引:0,他引:2
Fuzzy clustering helps to find natural vague boundaries in data. The fuzzy c-means method is one of the most popular clustering methods based on minimization of a criterion function. Among many existing modifications of this method, conditional or context-dependent c-means is the most interesting one. In this method, data vectors are clustered under conditions based on linguistic terms represented by fuzzy sets. This paper introduces a family of generalized weighted conditional fuzzy c-means clustering algorithms. This family include both the well-known fuzzy c-means method and the conditional fuzzy c-means method. Performance of the new clustering algorithm is experimentally compared with fuzzy c-means using synthetic data with outliers and the Box-Jenkins database. 相似文献
16.
经典的模糊c均值聚类算法对非球型或椭球型分布的数据集进行聚类效果较差。将经典的模糊c均值聚类中的欧氏距离用Mahalanobis距离替代,利用Mahalanobis距离的优点,将其用于增量学习中,提出一种基于马氏距离的模糊增量聚类学习算法。实验结果表明该算法能较有效地解决模糊聚类方法中的缺陷,提高了训练精度。 相似文献
17.
18.
叶鹏 《电脑编程技巧与维护》2010,(20):20-22
介绍一种基于模糊逻辑的数据聚类技术,讨论了模糊C均值聚类方法。模糊C均值算法就是利用模糊逻辑理论和聚类思想,将n样本划分到c个类别中的一个,使得被划分到同一簇的对象之间相似度最大,而不同簇之间的相似度最小。 相似文献
19.
Clustering for symbolic data type is a necessary process in many scientific disciplines, and the fuzzy c-means clustering for interval data type (IFCM) is one of the most popular algorithms. This paper presents an adaptive fuzzy c-means clustering algorithm for interval-valued data based on interval-dividing technique. This method gives a fuzzy partition and a prototype for each fuzzy cluster by optimizing an objective function. And the adaptive distance between the pattern and its cluster center varies with each algorithm iteration and may be either different from one cluster to another or the same for all clusters. The novel part of this approach is that it takes into account every point in both intervals when computing the distance between the cluster and its representative. Experiments are conducted on synthetic data sets and a real data set. To compare the comprehensive performance of the proposed method with other four existing methods, the corrected rand index, the value of objective function and iterations are introduced as the evaluation criterion. Clustering results demonstrate that the algorithm proposed in this paper has remarkable advantages. 相似文献