首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 473 毫秒
1.
针对模糊C均值(FCM)聚类算法没有考虑样本不同属性的重要程度、邻域信息等问题,提出一种基于熵与邻域约束的FCM算法。首先通过计算样本各属性的熵值来为各属性赋予权重,结合属性权重改进距离度量函数;随后根据邻域样本与中心样本间的距离计算邻域隶属度权重,加权得到邻域隶属度,利用邻域隶属度约束目标函数,修正隶属度迭代过程,最终达到提升FCM聚类算法性能的目的。理论分析和在人造数据集、多个UCI数据集的试验结果表明,改进后的算法在聚类效果、鲁棒性上均优于传统FCM算法、PCM算法、KFCM算法、KPCM算法和DSFCM算法,表明了本文算法的有效性。  相似文献   

2.
针对传统模糊C-均值(Fuzzy C-Means, FCM)聚类算法隐含假设各个样本和各维属性对聚类结果作用相同,导致算法聚类性能降低,以及对初始中心点敏感且易陷入局部最优的问题,提出一种基于改进蝙蝠算法优化的FCM聚类算法。该算法首先采用混沌映射和速度权重来改进蝙蝠算法,然后利用改进蝙蝠算法确定FCM算法的初始聚类中心,最后根据各个样本和各维属性对聚类结果作用不同,采用样本和属性加权法对FCM算法的目标函数重新设计。实验结果表明,改进算法表现出较好的聚类效果。  相似文献   

3.
面向混合属性数据集的改进半监督FCM聚类方法   总被引:1,自引:0,他引:1  
李晓庆  唐昊  司加胜  苗刚中 《自动化学报》2018,44(12):2259-2268
针对混合属性数据集聚类精度低的问题,本文提出一种基于改进距离度量的半监督模糊均值聚类(Fuzzy C-means,FCM)算法.首先,在数据集中针对类别属性进行预处理,并设置相应的相异度阈值;将传统聚类距离度量与改进的Jaccard距离度量结合,确定混合属性数据集的距离度量函数;最后,将所得距离度量函数与传统半监督FCM算法相结合,并在滚动轴承的不同复合故障数据的特征集中进行聚类.实验表明,该算法能在含无序属性的混合属性数据集的聚类中取得更好的聚类效果.  相似文献   

4.
谢建华  李海燕  井元伟 《控制与决策》2006,21(10):1092-1096
在加权模糊c-均值(FCM)聚类算法的基础上,对分色算法进行了改进.首先进行色彩空间模型转换,然后对基于样本加权的FCM算法进行改进,对隶属度进行调整,把二维彩色直方图引入加权系数中.对于模糊c-均值算法,当隶属度接近时,分类会变得模糊,而且对于不同的样本矢量,聚类效果有所不同,本算法兼顾到了这两点.该方法已用Visual C++6.0编程实现,效果比较理想.  相似文献   

5.
混合属性数据点集的特征权重优化方法研究   总被引:1,自引:1,他引:0       下载免费PDF全文
应用决策树方法来获取混合属性数据点集的“规则聚类区域”,利用“异类子聚类相离,同类子聚类相近”的原则来交替优化有序属性和无序属性的权重,提出了基于决策树划分的特征权重优化方法。该方法在一定程度上解决了有效获取数据子集的子聚类问题和混合属性数据点集的特征权重优化难题。仿真实验表明,该方法在优化混合属性数据点集的特征权重时是有效的。  相似文献   

6.
K-Means聚类算法和FCM算法混合运行的角度来探讨聚类问题,针对FCM算法初始化隶属度矩阵的随机性问题,提出了一种混合均值聚类算法。在混合算法运行过程中,利用前者的聚类结果信息来初始化后者的初始中心,依此来计算FCM算法初始隶属度矩阵,通过FCM算法的运行,最终实现数据集的聚类目的。实验结果表明该混合均值算法比单纯使用FCM算法效果好。  相似文献   

7.
提出一种基于图像区域特征估计聚类数的快速FCM图像分割算法。在算法的预测分析阶段, 利用由共生矩阵统计值所构成的特征矢量描述图像中区域特征并结合多个聚类有效性判定函数实现准确的聚类数估计和隶属度矩阵值的初始化。在主聚类阶段,采用Gabor滤波器提取的颜色纹理隐式混合特征进行聚类,不但能获得更加合理的区域分割质量,同时也具有较好的抗噪声能力。实验表明改进算法有效克服基于像素点级特征的FCM图像分割算法在聚类数估计和隶属度矩阵初始化方面的不足,加快FCM主聚类阶段的迭代速度,执行效率更高。  相似文献   

8.
为了满足数据分析中获取含有混合属性的数据集聚类的边界需求, 提出一种混合属性数据集的聚类边界检测算法(BERGE). 该算法利用模糊聚类隶属度定义边界因子以识别候选边界集, 然后运用证据积累的思想提取聚类的边界. 在综合数据集和真实数据集上的实验结果表明, BERGE 算法能有效地检测混合属性数据集、数值属性数据集以及分类属性数据集的聚类边界, 与现有同类算法相比具有更高的精度.  相似文献   

9.
针对模糊C均值聚类(Fuzzy c-Means Clustering, FCM)算法聚类过程迭代的特点,采用迭代式MapReduce模型对FCM算法进行了优化实现。Map函数计算每个样本到聚类中心的隶属度,Reduce函数接收Map函数的中间输出计算新的聚类中心,传递模块将最新聚类中心传送给原Map任务所在节点,供新一轮MapReduce job使用。迭代式MapReduce模型在MapReduce基本模型上添加了传递模块,有效解决了基本模型在处理迭代问题上存在的不足。在Hadoop平台中,分别使用基于迭代式MapReduce和MapReduce基本模型的FCM算法对变压器进行故障诊断。实验结果表明,基于迭代式MapReduce的FCM算法诊断速度达到了基于MapReduce基本模型算法诊断速度的12倍以上,误判率降低了12%~15%,有效提升了FCM算法的诊断效率。  相似文献   

10.
传统的聚类算法通常将样本间的距离作为相似度的划分标准,因此距离计算方式的选择对于聚类的结果至关重要.但是传统的距离计算方法忽略了不同数据属性特征对聚类的影响.为了解决此问题,论文结合K-means提出了一种基于属性加权的快速K-means算法FAWK.首先,定义了一个反映属性特征差异的离散度函数对属性特征进行加权;其次,根据加权属性特征计算数据属性间的距离,并将所有属性的加权属性距离求和作为样本间的相似性距离;然后,将加权属性距离作为FAWK算法的划分标准对数据进行聚类;最后,将论文算法与现有方法在8个UCI数据集和LAMOST恒星光谱数据集进行实验测试与分析,实验结果表明FAWK算法具有迭代次数少、运行时间短、聚类结果准确率高且更接近真实数据集划分情况的特点.  相似文献   

11.
基于马氏距离特征加权的模糊聚类新算法   总被引:2,自引:0,他引:2       下载免费PDF全文
模糊聚类分析是模糊模式识别中一个重要研究领域,而其中最经典的模糊C均值算法认为样本矢量各特征对聚类结果贡献均匀,没有考虑不同的属性特征对模式分类的不同影响,在处理属性高相关的数据集时,该算法分错率增加。针对这些问题,提出了一种基于马氏距离特征加权的模糊聚类算法,利用自适应马氏距离的优点对特征加权处理,对高属性相关的数据集进行更有效的分类。实验证明该方法的可行性和有效性。  相似文献   

12.
基于属性权重的Fuzzy C Mean算法   总被引:16,自引:0,他引:16  
提出CF-WFCM算法,该算法分为属性权重学习算法和聚类算法两部分.属性权重学习算法,从数据自身的相似性出发,通过梯度递减算法极小化属性评价函数CFuzziness(ω),为每个属性赋予一个权重.将属性权重应用于Fuzzy C Mean聚类算法,得到CF-WFCM算法的聚类算法.CF-WFCM算法强化重要属性在聚类过程中的作用,消减冗余属性的作用,从而改善聚类的效果.我们选取了部分UCI数据库进行实验,实验结果证明:CF-WFCM算法的聚类结果优于FCM算法的聚类结果.函数CFuzziness(ω)不仅可以评价属性的重要性,而且可以评价属性评价函数的优劣.实验说明了这一问题.最后我们对CF-WFCM算法进行了讨论.  相似文献   

13.
传统K-Modes算法的一个主要问题是属性选择问题。K-Modes算法在聚类过程中对每一个属性都同等看待,而在实际应用中,很多数据集仅有几个重要属性对聚类起作用。为了考虑不同属性对聚类的不同影响,将K-Modes聚类算法与属性权重的最优化结合起来,提出一种属性自动赋权的FW-K-Modes算法。该算法不仅可以提高传统K-Modes聚类算法的聚类精度,还能分析各维属性对聚类的贡献程度,实现关键属性的选择。对多个UCI数据集进行了实验,验证了该算法的优良特性。  相似文献   

14.
在遥感图像分割领域,模糊C均值聚类算法得到了广泛的应用。但存在计算量大、易受噪声干扰等缺点。针对以上缺点对快速模糊C均值聚类算法进行了改进。首先利用一维灰度直方图进行快速模糊C均值聚类降低计算量;然后在此基础上根据像素的邻域特性构造新的隶属度函数;最后根据新的隶属度函数对每个像素进行分类。实验结果表明,该算法能快速有效地分割图像,并具有较强的抗噪能力。  相似文献   

15.
快速模糊C均值聚类的图像分割方法   总被引:11,自引:1,他引:10       下载免费PDF全文
模糊C均值(FCM)聚类算法广泛应用于图像的自动分割,但标准的FCM算法存在计算量大,运算速度慢等问题。对FCM算法进行改进,提出了一种快速FCM图像分割算法(FFCM),该算法将图像从像素空间映射到其灰度直方图特征空间,并在此基础上,充分利用像素的邻域特性,对隶属度函数做一定改进,实验结果表明该算法能快速有效地分割图像,并具有较好的抗噪能力。  相似文献   

16.
Among fuzzy clustering methods, fuzzy c-means (FCM) is the most recognized algorithm. In this algorithm, it is assumed that all the features are of equal importance. In real applications, however, the importance of the features are different and there exist some features that are more important than the others. These important features should basically have more effects than the other features in the forming of optimal clusters. The basic FCM algorithm does not support this idea. Also, the FCM algorithm suffers from another problem; the algorithm is very sensitive to initialization, whereas a bad initialization leads to a poor local optima. Some improved versions of FCM have been proposed in the literature, each of which has somehow mitigated the first problem or the second one. In this paper, motivated by these weaknesses of the FCM, the goal is to solve the two problems at the same time. In doing so, an automatic local feature weighting scheme is proposed to properly weight the features of each clusters. And, a cluster weighting process is performed to mitigate the initialization sensitivity of the FCM. Feature weighting and cluster weighting are performed simultaneously and automatically during the clustering process resulting in high quality clusters, regardless of the initial centers. Extensive experiments conducted on a synthetic dataset and 16 real world datasets indicate that the proposed algorithm outperforms the state-of-the-arts algorithms. The convergence proof of the proposed algorithm is also provided.  相似文献   

17.
基于方差权重矩阵模型的高维数据子空间聚类算法   总被引:1,自引:1,他引:0  
在处理高维数据时,聚类的工作往往归结为对子空间的划分问题。大量的真实实验数据表明,相同的属性对于高维数据的每一类子空间而言并不是同等重要的,因此,在FCM算法的基础上引入了方差权重矩阵模型,创造出了新的聚类算法称之为WM-FCM。该算法通过不断地聚类迭代调整权重值,使得其重要的属性在各个子空间内更为显著地表征出来,从而达到更好的聚类效果。从基于模拟数据集以及UCI数据集的实验结果表明,该改进的算法是有效的。  相似文献   

18.
学习特征权值对K-均值聚类算法的优化   总被引:21,自引:0,他引:21  
K-均值(K—means)算法聚类的结果依赖于距离度量的选取.传统的K-均值算法选择的相似性度量通常是欧几里德距离的倒数,这种距离通常涉及所有的特征.在距离公式中引入一些特征权参数后,其聚类结果将依赖于这些权值,从而可以通过调整这些权值优化聚类效果.由于K-均值算法是迭代算法,很难直接确定其权值以优化聚类结果,因此提出了一种间接的学习权值算法以改进聚类结果.从数学意义上讲,这种权值学习相当于欧氏空间中对一组点进行了一个线性变换.数值实验证实了算法的有效性.  相似文献   

19.
模糊聚类,特别是模糊C均值聚类算法(FCM)广泛地运用到图像的分割中。但是传统的算法未对数据对特征进行优化,亦未考虑图像的空间信息,对噪声图像分割不理想。在FCM目标函数中引入核函数,用内核引导距离代替传统的欧式距离,同时考虑到邻近象素的影响,增加了空间约束项,提出了利用空间信息的核FCM算法。通过对模拟图和仿真脑部MR图像的分割实验证明,该算法可以有效的分割含有噪声图像。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号