首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
初始聚类中心优化选取的核C-均值聚类算法   总被引:4,自引:1,他引:3  
在通常的核C-均值聚类算法中,聚类结果对初始聚类中心敏感,随机选取初始聚类中心时,会使得迭代次数较多、分类结果不稳定.针对该问题提出一种优化选取仞始聚类中心的算法.该方法采用一种改进的最大最小距离算法对原始空间中的数据进行粗分类,将粗分类结果中每类类心作为初始聚类中心,再运用核C-均值聚类算法进行分类.仿真实验结果表明方法能有效减少迭代次数,使分类结果更加稳定,分类识别率也有一定程度的提高.  相似文献   

2.
基于最大最小距离和动态隧道的聚类算法   总被引:2,自引:0,他引:2  
针对K-means聚类算法对初值敏感和易陷入局部最小值的缺陷,提出了一种基于最大最小距离和动态隧道的聚类算法.该算法首先利用最大最小距离法来优选初始聚类中心以避免由于聚类中心过于随机而导致其分布较为集中的情形,以提高划分初始数据集的效率.动态隧道法具有全局寻优能力,利用钻隧过程可跳出局部极小点得到更小值点,再由K-means聚类算法对其迭代优化,如此反复直至得到全局极值.实验结果表明了该算法的可行性和有效性.  相似文献   

3.
针对初始聚类中心不合理的选择会导致K-means算法的聚类结果局部最优,且降低聚类算法收敛速度的问题,提出一种基于近邻传播算法和最大最小距离算法联合计算初始聚类中心的算法(APMMD).该算法通过近邻传播算法从整个样本集中获得Kap(Kap>k)个具有代表性的候选中心点,再利用最大最小距离算法从Kap个候选中心点中选择...  相似文献   

4.
针对快速K-me doids聚类算法所选初始聚类中心可能位于同一类簇的缺陷,以及基于粒计算的K-medoids算法构造样本去模糊相似矩阵时需要主观给定阈值的缺陷,提出了粒计算优化初始聚类中心的K-medoids聚类算法。该算法结合粒计算与最大最小距离法,优化K-medoids算法初始聚类中心的选取,选择处于样本分布密集区域且相距较远的K个样本作为初始聚类中心;使用所有样本的相似度均值作为其构造去模糊相似矩阵的阈值。人工模拟数据集和UCI机器学习数据库数据集的实验测试表明,新K-medoids聚类算法具有更稳定的聚类效果,其准确率和Adjusted Rand Index等聚类结果评价指标值优于传统K-medoids聚类算法、快速K-medoids聚类算法和基于粒计算的K-medoids聚类算法。  相似文献   

5.
随机选取初始聚类中心和根据经验设置[K]值对[K]-means聚类结果都有一定的影响,针对这一问题,提出了一种基于加权密度和最大最小距离的[K]-means聚类算法,称为[KWDM]算法。该算法利用加权密度法选取初始聚类中心点集,减少了离群点对聚类结果的影响,通过最大最小距离准则启发式地选择聚类中心,避免了聚类结果陷入局部最优,最后使用准则函数即簇内距离和簇间距离的比值来确定[K]值,防止了根据经验来设置[K]值。在人工数据集和UCI数据集上的实验结果表明,KWDM算法不仅提高了聚类的准确率,而且减少了算法的平均迭代次数,增强了算法的稳定性。  相似文献   

6.
聚类是非监督学习的关键问题.本文在模糊最小-最大聚类网络(FMMCN)和分层聚类思想的基础上,提出一种分层模糊最小-最大聚类算法.与目前的常用聚类算法相比,该方法可以根据问题需要动态确定聚类数目,并克服FMMCN样本输入次序依赖性的缺陷.对相关数据集的实验结果表明该方法具有优良的聚类性能.  相似文献   

7.
最大距离法选取初始簇中心的K-means文本聚类算法的研究   总被引:1,自引:0,他引:1  
由于初始簇中心的随机选择, K-means算法在聚类时容易出现聚类结果局部最优、聚类结果不稳定、总迭代次数较多等问题。为了解决K-means算法所存在的以上问题, 提出了最大距离法选取初始簇中心的K-means文本聚类算法。该算法基于这样的事实:距离最远的样本点最不可能分到同一个簇中。为使该算法能应用于文本聚类, 构造了一种将文本相似度转换为文本距离的方法, 同时也重新构造了迭代中的簇中心计算公式和测度函数。在实例验证中, 对分属于五个类别的1 500篇文本组成的文本集进行了文本聚类分析, 其结果表明, 与原始的K-means聚类算法以及其他的两种改进的K-means聚类算法相比, 新提出的文本聚类算法在降低了聚类总耗时的同时, F度量值也有了明显提高。  相似文献   

8.
分类是数据挖掘的一项重要研究内容。在分析了现有分类方法后,提出了基于最小距离的多中心向量的增量分类算法。该方法首先按照属性类聚类训练样本,通过类间调整,消除类域空间重叠。针对增量分类,提出了多中心向量的分类算法,通过空间区域划分的方法,减少增量分类选取的代表样本数量。实验结果表明,与文献[14]提出的增量分类算法相比,分类精度近似相同,但所需时间复杂度和存储空间则有不同程度的下降,这对大数据的处理是具有重要意义的。  相似文献   

9.
针对传统K-均值聚类算法初始聚类中心和聚类数目确定困难的问题,提出了基于密度统计法和最大距离乘积法的聚类中心选取方法.该方法通过对样本空间网格化,选出局部包含样本最多的网格,并对这些局部最优网格内的样本点进行ε邻域密度统计,然后取邻域密度最大且相距最远的两个样本点为聚类中心进行一次聚类.计算每个样本点到各个聚类中心的距离的积,取距离积最大的样本点为下一个聚类中心,并以此循环聚类.仿真实验表明,该方法在聚类精度上具有明显优势.  相似文献   

10.
针对K‐means算法随机选择初始聚类中心所出现的样本聚类结果随机性强、稳定性低、容易陷入局部最优和得不到全局最优解等问题,提出一种基于均值与最大距离乘积的初始聚类中心优化K‐means算法。该算法首先选择距离样本集均值最远的数据对象加入聚类中心集合,再依次将与样本集均值和当前聚类中心乘积最大的数据对象加入聚类中心集合。标准数据集上的实验结果表明,与原始K‐means的算法以及另一种改进算法相比,新提出的聚类算法具有更高的准确率。  相似文献   

11.
李莲  罗可  周博翔 《计算机应用研究》2013,30(10):2916-2919
针对传统K-means聚类算法初始聚类中心随机选取、不能处理边界对象、效率低、聚类精度低等问题, 提出了一种新的K-means聚类算法。算法引入粒计算理论, 并依据密度和最大最小距离法选择初始聚类中心, 避免初始聚类中心在同一个类中, 结合粗糙集, 通过动态调整上近似集和边界集的权重因子, 以解决边界数据的聚类问题; 最后采用类间距和类内距均衡化准则函数作为算法终止判断条件, 来得到更好的聚类效果。实验结果表明:该算法具有较高的准确率, 迭代次数较少, 并降低了对噪声的敏感程度。  相似文献   

12.
传统K均值聚类(KMC)算法过分依赖初始值的设置,容易陷入局部最优;混合蛙跳算法(SFLA)存在收敛速度和搜索速度较慢、局部和全局信息交流不全面等缺点。针对以上缺点,首先提出一种改进的混合蛙跳算法(MSFLA)。该算法根据粒子群优化和差分进化思想,在青蛙个体变异时,引入上一次移动距离的权重惯性系数和缩放因子,从种群中的最优位置和历史最优位置之间的随机点出发,以子群内的青蛙的平均值和最差位置差值为步长进行青蛙个体的更新操作。再将MSFLA与KMC算法结合提出MSFLA-KMC算法,有效地克服了KMC算法过分依赖初始值设置问题,同时降低了KMC算法陷入局部最优的可能性。实验结果表明,MSFLA具有较强的寻优能力,MSFLA-KMC算法则具有更好的聚类性能。  相似文献   

13.
针对现有的基于流形距离的聚类算法对“绝对流形”数据集较“相对流形”数据集聚类效果佳和参数[ρ]在较大范围内变化时,聚类性能较差等问题,提出基于改进流形距离的粗糙集k-means聚类算法。该算法通过用属性划分和最大最小距离选择初始聚类中心,以改进的流形距离和粗糙集优化k-means,并结合终止判断条件以达到解决边界数据聚类问题和提升聚类效果的目的。仿真结果表明:该算法对“绝对流形”和“相对流形”数据集聚类效果均有较好改善,且参数变化对聚类性能影响较大。  相似文献   

14.
针对传统图像分割算法对不同类型噪声敏感性缺陷的问题,基于临近像素空间距离的模糊C均值聚类算法即SFCM (fuzzy C means clustering algorithm based on the space distance of the nearest pixels)算法,采用核化的空间距离公式,将点到点之间的距离转化为点到空间的距离,很好的平衡了考察像素点临近像素点的灰度信息与位置信息间的关系,进一步克服了临近像素的位置差异对考察像素影响不同的缺点.通过在合成图像和自然图像上的大量实验并与几个传统算法进行对比,不仅表现出了很强的抗干扰能力,提高了聚类精度,并且很好的保留了原图像边缘等细节信息,体现出了较强的鲁棒性.  相似文献   

15.
张瑞丽  张继福 《计算机应用》2012,32(7):1978-1982
针对模糊C-均值(FCM)算法易陷入局部最优值以及对聚类中心和噪声数据敏感问题,提出了一种基于w-距离均值的模糊聚类算法。首先根据数据自身的分布规律,依据样本间距离均值思想确定初始聚类中心,并引入了调衡因子w来调节距离均值阈值;其次为每个样本赋予权值,并利用样本权值修改了聚类中心公式和目标函数公式,提高了算法的抗噪性;最后实验结果验证了所提算法可以有效地解决聚类效果往往受初始聚类中心的影响的问题,避免了局部收敛,增强了抗噪性,准确率和效率较高。  相似文献   

16.
基于相对距离的密度聚类算法*   总被引:1,自引:0,他引:1  
首先介绍传统距离计算方法在聚类应用中的不足,并针对这点提出一种基于权重向量的相对距离计算方法。在应用DBSCAN算法的基础上,融入相对距离的计算及k-d树的范围查找的应用。该算法不仅能得到很好的聚类效果,而且消除了数据的度量单位对聚类结果的影响。  相似文献   

17.
目的 为了进一步提高噪声图像分割的抗噪性和准确性,提出一种结合类内距离和类间距离的改进可能聚类算法并将其应用于图像分割。方法 该算法避免了传统可能性聚类分割算法中仅仅考虑以样本点到聚类中心的距离作为算法的测度,将类内距离与类间距离相结合作为算法的新测度,即考虑了类内紧密程度又考虑了类间离散程度,以便对不同的聚类结构有较强的稳定性和更好的抗噪能力,并且将直方图融入可能模糊聚类分割算法中提出快速可能模糊聚类分割算法,使其对各种较复杂图像的分割具有即时性。结果 通过人工合成图像和实际遥感图像分割测试结果表明,本文改进可能聚类算法是有效的,其分割轮廓清晰,分类准确且噪声较小,其误分率相比其他算法至少降低了2个百分点,同时能获得更满意的分割效果。结论 针对模糊C-均值聚类分割算法和可能性聚类分割算法对于背景和目标颜色相近的图像分类不准确的缺陷,将类内距离与类间距离相结合作为算法的测度有效的解决了图像分割归类问题,并且结合直方图提出快速可能模糊聚类分割算法使其对于大篇幅复杂图像也具有适用性。  相似文献   

18.
章曼  张正军  冯俊淇  严涛 《计算机应用》2022,42(6):1914-1921
针对基于快速搜索和发现密度峰值的聚类(CFSFDP)算法中截断距离需要人工选取,以及最近邻分配带来的误差导致的在具有不同密度簇的复杂数据集上的聚类效果不佳的问题,提出了一种基于自适应可达距离的密度峰值聚类(ARD-DPC)算法。该算法利用非参数核密度估计方法计算点的局部密度,根据决策图选取聚类中心,并利用自适应可达距离分配数据点,从而得到最终的聚类结果。在4个合成数据集和6个UCI数据集上进行了仿真实验,将所提算法ARD-DPC与基于快速搜索和发现密度峰值的聚类(CFSFDP)、基于密度的噪声应用空间聚类(DBSCAN)、基于密度自适应距离的密度峰聚类(DADPC)算法进行了比较,实验结果表明,相比其他三种算法,ARD-DPC算法在7个数据集上的标准化互信息(NMI)、兰德指数(RI)和F1-measure取得了最大值,在2个数据集分别取得F1-measure和NMI的最大值,只对模糊度较高、聚类特征不明显的Pima数据集聚类效果不佳;同时,ARD-DPC算法在合成数据集上能准确地识别出聚类数目和具有复杂密度的簇。  相似文献   

19.
针对K-means对初始聚类中心敏感和易陷入局部最优的缺点,提出了一种改进的基于粒子群的聚类算法.该算法结合基于密度和最大最小距离法来确定初始聚类中心,解决K-means对初始值敏感的问题;利用粒子群算法全局寻优能力强的优点,避免K-means陷入局部最优.通过对样本集各维属性的规范化处理,惯性权值采用凹函数递减,计算相异度矩阵,引入用群体适应度方差,进一步优化混合算法.实验结果表明,该算法具有更高的准确率和更强的收敛能力.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号