首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
庞淑敬  彭建 《微计算机信息》2012,(1):161-162,172
针对数据集中若存在孤立点或者是噪声数据会影响模糊C均值聚类算法(FCM)的聚类性能问题,本文将离群点的辨认方法与FCM算法相结合,提出一种改进的FCM聚类算法。该算法有效地降低了孤立点或噪声数据对正常数据的影响,提高了FCM算法的聚类精度。将该算法在入侵检测系统中进行实验验证,通过与FCM算法进行对比分析,证明了该算法的有效性和可行性。  相似文献   

2.
一种基于隶属度优化的演化聚类算法   总被引:1,自引:0,他引:1  
针对FCM中数据点隶属度的计算是影响算法执行效率的主要因素,提出一种新的加速FCM算法(accelerated fuzzy C-means,AFCM),用于加速FCM及基于FCM的演化聚类算法.AFCM算法采用抽样初始化操作,产生较好的初始聚类中心,对于拥有较大隶属度的数据点,通过一步k-means操作更新模糊聚类中心,同时仅更新小隶属度来达到加速FCM算法的目的.为了验证所提出方法的有效性并提高聚类算法的效率,将AFCM应用于基于演化算法的模糊聚类算法.实验表明,此方法在保持良好的聚类结果前提下,能够减少大规模数据集上聚类算法的计算时间.  相似文献   

3.
基于约简数据集的FCM聚类算法   总被引:1,自引:0,他引:1  
为了解决模糊C-均值(FCM)聚类算法在使用欧氏距离计算样本与类中心点的距离时计算量大的问题,提出了一种基于属性约简的FCM聚类算法.该算法根据粗糙集理论对初始数据进行属性约简,消除数据对象中的冗余值,然后再对约简后的属性集进行模糊聚类.实验结果表明,该算法能有效减少FCM算法的距离函数计算量,在不降低聚类精度的前提下,提高了FCM算法的执行效率.  相似文献   

4.
FCM算法是目前广泛使用的算法之一。,针对FCM聚类质量和收敛速度依赖于初始聚类中心的问题,结合Canopy聚类算法能够粗略快速地对数据集进行聚类的优点,提出了一种基于Canopy聚类的FCM算法。该算法通过将Canopy算法快速获取到的聚类中心作为FCM算法的输入来加快FCM算法收敛速度。并在云环境下设计了其MapReduce化方案,实验结果表明,MapReduce化的基于Canopy聚类的FCM算法比MapReduce化的FCM聚类算法具有更好的聚类质量和运行速度。  相似文献   

5.
针对模糊C—均值(FCM)聚类算法聚类结果依赖于初始中心的选取,易收敛于局部极值等问题,提出了一种密度峰值聚类(DPC)算法和FCM相结合的混合聚类方法(DPC-FCM),利用密度峰值快速搜索算法可以比较准确地刻画聚类初始中心的特点,改善FCM聚类算法存在的不足,从而实现优化聚类.在UCI数据集和人工模拟数据集上的实验结果显示:融合后的新算法和传统的FCM算法相比有着更高的正确率和更快的收敛速度,证明了新算法的可行性.  相似文献   

6.
模糊C-均值(FCM)聚类算法是目前最流行的数据集模糊划分方法之一.但是,有关聚类类别数的合理选择和确定,即聚类有效性分析,对FCM算法而言仍是一个开放性问题.为此,本文结合数据集的几何结构信息和FCM算法的模糊划分信息,重新定义了划分矩阵,进而利用划分模糊度提出了一种新的模糊聚类有效性函数.实验结果表明该方法是有效的且具有良好的鲁棒性.  相似文献   

7.
传统的快速聚类算法大多基于模糊C均值算(Fuzzy C-means,FCM),而FCM对初始聚类中心敏感,对噪音数据敏感并且容易收敛到局部极小值,因而聚类准确率不高。建立使用分治策略解决聚类问题的算法架构,充分考虑数据本身特性并对传统的FCM算法进行改进,标准数据集的实验结果表明这种基于分治策略的FCM聚类算法较好地提高了算法的聚类准确率,加快了收敛速度。  相似文献   

8.
模糊C均值聚类算法在算法初始化时需要人为设定聚类类别数、随机初始化聚类中心,致使该算法容易陷入局部最优值.为解决此类问题,在蚁群算法中引入信息素更新机制,使其输出的聚类中心更具全局优化的特征和较强鲁棒性的特点;用蚁群算法得到的聚类中心来初始化FCM算法的聚类中心,解决了FCM算法对初始聚类中心敏感的问题;使用结合熵信息与数据几何结构的聚类有效性评价方法对FCM算法和优化FCM算法进行评价,评价结果表明优化的FCM算法性能更优.在仿真实验中,利用提出的优化算法和FCM算法对自然图像、纹理图像和SAR图像进行分割实验,从图像分割的准确性和算法的实时性做对比实验,验证了优化算法的有效性.  相似文献   

9.
FCM算法用于灰度图像分割的初始化方法的研究   总被引:2,自引:1,他引:1  
匡泰  朱清新  孙跃 《计算机应用》2006,26(4):784-786
模糊C均值聚类(FCM)算法是一种经典的模糊聚类分析方法,但其算法初始聚类中心集是随机选取的,从而造成算法的性能强烈的依赖聚类中心集的初始化。提出了一种改进的基于多项式求解的FCM(PFCM)算法,该算法基于求解多项式的根来确定数据集初始聚类中心集,很好地解决了数据初始聚类中心集问题,使数据初始聚类中心集代表了数据集类别的特征,在此基础上,采用FCM算法得到聚类中心集的近似最优解。  相似文献   

10.
模糊 C 均值(FCM)聚类算法采取随机选取聚类中心的方法,这种方法使得 FCM 算法在局部范围内容易获得最优解,但在全局范围内效果较差,且 FCM 算法中聚类簇的个数一般需要人为设定.面对上述种种问题,文中将蚁群聚类算法和 FCM 聚类算法进行结合,获得了一种改进的 FCM 聚类算法.该算法在初步聚类中利用蚁群聚类产生聚类中心和簇的个数,将产生的聚类中心提供给 FCM 算法进行再次聚类.利用蚁群聚类的全局搜索和并行运算的优点避免了聚类易陷入局部最优解的缺陷.经过实验验证,该算法较一般 FCM 算法具有更好的性能.  相似文献   

11.
传统的快速聚类算法大多基于模糊C均值算法(Fuzzy C-means,FCM),而FCM对初始聚类中心敏感,对噪音数据敏感并且容易收敛到局部极小值,因而聚类准确率不高。可能性C-均值聚类较好地解决了FCM对噪声敏感的问题,但容易产生一致性聚类。将FCM和可能性C-均值聚类结合的聚类算法较好地解决了一致性聚类问题。为进一步提高算法收敛速度和鲁棒性,提出一种基于核的快速可能性聚类算法。该方法引入核聚类的思想,同时使用样本方差对目标函数中参数η进行优化。标准数据集和人造数据集的实验结果表明这种基于核的快速可能性聚类算法提高了算法的聚类准确率,加快了收敛速度。  相似文献   

12.
一种基于蚁群算法的模糊C均值聚类   总被引:22,自引:0,他引:22  
周新华  黄道 《控制工程》2005,12(2):132-134
针对模糊C均值(FCM)聚类算法,在选取聚类中心点时采用随机选取易使得迭代过程陷入局部最优解,FCM算法自身并不能确定聚类个数需要人为设定,并在数据分类应用时具有了一定误差的问题,提出了一种基于蚁群算法的FCM聚类算法。该算法根据蚁群聚类算法确定模糊聚类个数和FCM算法的初始聚类中心:利用蚁群算法的全局搜索性、并行计算性等特点避免了聚类陷入局部最优解:仿真结果表明了该算法的有效性。  相似文献   

13.
模糊C均值聚类(Fuzzy C-means Clustering, FCM)算法是分析医学数据的重要方法之一,FCM的聚类效果容易受初始聚类中心的影响;诸多研究人员往往采用多种群遗传算法(Multiple Population Genetic Algorithm, MPGA)解决上述问题,但MPGA的全局搜索能力不足并缺少自适应性、易过早收敛、初始聚类中心不佳.为此,本文提出一种DMGA-FCM:衍生多种群遗传进化(DMGA)的FCM自适应聚类算法.在DMGA-FCM中,本文首次提出的衍生算子,对初始化种群进行衍生操作,提升算法寻优能力,处理种群间寻优能力不足;利用模糊控制动态调节遗传概率,以提升算法自适应性,进而增强DMGA算法全局寻优能力,避免过早收敛;用DMGA优化FCM算法的初始聚类中心,以提升算法聚类效果.在仿真实验中,本文将该算法与其他相关FCM算法进行对比,可得到更优的医疗数据聚类效果和图像聚类分割效果.  相似文献   

14.
K-Means聚类算法和FCM算法混合运行的角度来探讨聚类问题,针对FCM算法初始化隶属度矩阵的随机性问题,提出了一种混合均值聚类算法。在混合算法运行过程中,利用前者的聚类结果信息来初始化后者的初始中心,依此来计算FCM算法初始隶属度矩阵,通过FCM算法的运行,最终实现数据集的聚类目的。实验结果表明该混合均值算法比单纯使用FCM算法效果好。  相似文献   

15.
针对入侵检测方法中模糊C-均值(FCM)聚类算法对初始值敏感和要求输入聚类数目的缺点,把人工免疫网络算法用于FCM聚类算法,提出了一种基于人工免疫网络和模糊C-均值的入侵检测方法.通过KDD_CUP1999数据集仿真试验,与FCM算法相比,该算法提高了检测率,降低了误警率.实验结果表明,该方法能够有效地检测网络中的入侵行为.  相似文献   

16.
为了改进模糊C-均值(FCM)聚类算法对初始值和噪声数据敏感,且易陷入局部极小值的缺点,提出一种基于选择和变异机制的蛙跳FCM算法(SMSFLA-FCM)。该算法首先将线性递减的惯性权重引入蛙跳算法的更新策略中,按照一定的概率选择适应度值较优的青蛙代替较差青蛙,并对每只青蛙个体以不同的概率变异;再用改进后的蛙跳算法求得最优解作为FCM算法的初始聚类中心;然后利用FCM优化初始聚类中心;最后求得全局最优解,从而有效克服了FCM算法的缺点。人造数据和经典数据集的实验结果表明,SMSFLA-FCM与SF-LA-FCM和FCM聚类算法相比,提高了算法的寻优能力,且迭代次数更少,聚类效果更好。  相似文献   

17.
王治和  王淑艳  杜辉 《计算机工程》2021,47(5):88-96,103
模糊C均值(FCM)聚类算法无法识别非凸数据,算法中基于欧式距离的相似性度量只考虑数据点之间的局部一致性特征而忽略了全局一致性特征。提出一种利用密度敏感距离度量创建相似度矩阵的FCM算法。通过近邻传播算法获取粗类数作为最佳聚类数的搜索范围上限,以解决FCM算法聚类数目需要人为预先设定和随机选定初始聚类中心造成聚类结果不稳定的问题。在此基础上,改进最大最小距离算法,得到具有代表性的样本点作为初始聚类中心,并结合轮廓系数自动确定最佳聚类数。基于UCI数据集和人工数据集的实验结果表明,相比经典FCM、K-means和CFSFDP算法,该算法不仅具有识别复杂非凸数据的能力,而且能够在保证聚类性能和稳定性的前提下加快收敛速度。  相似文献   

18.
改进的快速模糊C-均值聚类算法   总被引:4,自引:1,他引:4       下载免费PDF全文
为解决模糊C-均值(FCM)聚类算法在大数据量中存在的计算量大、运行时间过长的问题,提出了一种改进方法:先用多次随机取样聚类得到的类中心作为FCM算法的初始类中心,以减少FCM算法收敛所需的迭代次数;接着通过数据约减,压缩参与迭代运算的数据集,减少每次迭代过程的运算时间。该方法使FCM算法运算速度大大提高,且不影响算法的聚类效果。  相似文献   

19.
针对模糊C均值(Fuzzy C-Means,FCM)聚类算法对初始聚类中心和噪声敏感、对边界样本聚类不够准确且易收敛于局部极小值等问题,提出了一种K邻近(KNN)优化的密度峰值(DPC)算法和FCM相结合的融合聚类算法(KDPC-FCM)。算法利用样本的K近邻信息定义样本局部密度,快速准确搜索样本的密度峰值点样本作为初始类簇中心,改善FCM聚类算法存在的不足,从而达到优化FCM聚类算法效果的目的。在多个UCI数据集、单个人造数据集、多种基准数据集和Geolife项目中的6个较大规模数据集上的实验结果表明,改进后的新算法与传统FCM算法、DSFCM算法对比,有着更好的抗噪性、聚类效果和更快的全局收敛速度,证明了新算法的可行性和有效性。  相似文献   

20.
针对FCM算法应用于基因表达数据分析时存在的局限性,提出一种特征加权自适应FCM算法。该算法在FCM算法的基础上引入数据集预处理机制,可依据数据集的分布特征自适应地获取分类数目和初始聚类中心,并通过ReliefF算法实现特征权值的自动确定。同时,新算法考虑了不同属性对分类贡献的差异,在FCM算法中引入特征权重。将算法应用于真实基因表达数据集,实验结果表明,算法能够自适应地确定聚类数目、获得稳定性较好的聚类结果,而且具有较高的聚类精度。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号