首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 218 毫秒
1.
K-means算法由于其固有的初始聚类质心敏感性,存在聚类结果不稳定、容易收敛到局部最优等问题。现有改进方案在处理无噪数据集时能够在降低迭代次数的同时得到近似全局最优解,但在处理有噪数据集时容易陷入局部最优,甚至聚类效果低于传统的K-means算法。在最远空间距离确定初始质心算法的基础上,提出一种基于空间距离差的初始质心选择算法。该算法的核心思想是通过计算非聚类质心点到已选质心的距离和,并排序,选取相邻距离差最大的两点中靠近已知质心的点作为下一个簇的初始质心而实现的。实验结果表明,所提算法在聚类迭代次数相当的情况下,对不含噪声数据集的聚类准确度增加约1%,对于含有噪声的数据集,聚类准确度达到90%以上。  相似文献   

2.
启发式聚类算法采用局部搜索策略发现使得目标函数取极小值的聚类结果,即局部最优聚类结果。算法虽然具有收敛速度快等优点,但是初始解敏感问题严重地影响了聚类结果的质量。利用多个局部最优聚类结果中的共有信息设计启发式聚类算法。首先给出共有信息的定义及其发现算法FCI_G;然后利用共有信息设计启发式聚类算法CIGC;最后在多组仿真和实际数据集上考察了CIGC算法的性能。实验结果表明,共有信息对提高聚类算法质量有着显著的作用。  相似文献   

3.
K-means算法的初始聚类中心是随机选取的,不同的初始中心输入会得出不同的聚类结果。针对K-means算法存在的问题,提出一种融合K-means算法与聚类的快速搜索和发现密度峰算法的聚类算法(K-CBFSAFODP)。该算法是这样考虑的:类簇中心被具有较低局部密度的邻居点包围,且与具有更高密度的任何点都有相对较大的距离,以此来刻画聚类中心;再运用K-means算法进行迭代聚类,弥补了K-means聚类中心随机选取导致容易陷入局部最优的缺点;并且引入了熵值法用来计算距离,从而实现优化聚类。在UCI数据集和人工模拟数据集上的实验表明,融合算法不仅能得到较好的聚类结果,而且聚类很稳定,同时也有较快的收敛速度,证实了该融合算法的可行性。  相似文献   

4.
在许多领域中,聚类是重要分析技术之一,如数据挖掘、模式识别和图像分析。针对K-means算法过度依赖初始聚类中心的选择而陷入局部最优的问题,提出了基于自适应步长的萤火虫划分聚类算法,简称ASFA。利用萤火虫算法的随机性和全局搜索性,来找到指定数量的初始簇中心,进一步利用K-means得到精确的簇划分。在萤火虫聚类优化算法中,采用自适应步长代替原有的固定步长,从而避免算法陷入局部最优,且能获得精度更高的解。为了提高算法性能,将改进的新算法用于不同规模大小的标准数据集中,实验结果表明,ASFA与K-means、GAK、PSOK对比显示更好的聚类性能和更好的稳定性和鲁棒性,与其他文献中算法相比,ASFA在寻优精度方面能取得更好的效果。  相似文献   

5.
FCM是经典的聚类算法,广泛地应用于模式识别、数据挖掘等领域。FCM算法是一种梯度下降优化算法,对初始解敏感并且容易获得局部最优解。空间平滑能够避免启发式局部搜索算法掉入局部最优解。采用空间平滑策略构造一系列光滑程度不同的搜索空间,在不同的搜索空间中执行FCM算法,并利用前层搜索空间的聚类结果来引导本层搜索空间的聚类。FCMS(FCM based on multi-Space)能够跳过局部最优解的“陷阱”,增大获得全局最优解的概率,达到提高聚类质量的目的。给出了等距法空间平滑策略,并通过实验对比了FCMS算法与FCM算法的聚类质量。实验结果表明,空间平滑对FCM算法非常有效。  相似文献   

6.
在传统K-means算法中,初始簇中心选择的随机性,导致聚类结果随不同的聚类中心而不同。因此出现了很多簇中心的选择方法,但是很多已有的簇中心选择算法,其聚类结果受参数调节的影响较大。针对这一问题,提出了一种新的初始簇中心选择算法,称为WLV-K-means(weighted local variance K-means)。该算法采用加权局部方差度量样本的密度,以更好地发现密度高的样本,并利用改进的最大最小法,启发式地选择簇初始中心点。在UCI数据集上的实验结果表明,WLV-K-means算法不仅能够取得较好的聚类结果,而且受参数变化的影响较小,有更加稳定的表现。  相似文献   

7.
针对K-means算法易受初始聚类中心影响而陷入局部最优的问题,提出一种基于萤火虫智能优化和混沌理论的FCMM算法。首先利用最大最小距离算法确定聚类类别值K和初始聚类中心位置;然后以各聚类中心为基准点,利用Tent映射构建混沌空间,通过混沌搜索更新聚类中心,以降低初始聚类中心过于临近的影响,并改善算法易陷入局部最优的问题。仿真结果表明,FCMM算法的平均聚类精度相较于经典K-means算法和FA算法分别提高了7.51%和2.2%,成功避免算法陷入局部最优解,提高了划分初始数据集的效率和寻优精度。  相似文献   

8.
针对K-means聚类算法对初始聚类中心敏感和易陷入局部最优解的缺点,提出一种基于K-means的人工蜂群(ABC)聚类算法。将改进的人工蜂群算法和K-means迭代相结合,使算法对初始聚类中心的依赖性和陷入局部最优解的可能性降低,提高了算法的稳定性。通过基于反向学习的初始化策略,增强了初始群体的多样性。利用非线性选择策略,改善了过早收敛问题,提高了搜索效率。通过对邻域搜索范围的动态调整,提高了算法收敛速度,增强了局部寻优能力。实验结果表明,该算法不仅克服了K-means算法稳定性差的缺点,而且具有良好的性能和聚类效果。  相似文献   

9.
针对FCM聚类算法容易陷入局部最优且对初始点很敏感的问题,提出基于搜索空间平滑技术的点密度加权FCM算法以获得最优解。以所得的聚类中心作为输入,再次执行FCM算法,对于隶属度小于阈值的数据样本进行检测;如果该数据样本被删除,目标函数值变化明显,则该数据样本为异常数据样本,并且聚类最后产生的小的簇中的数据样本也是异常数据样本。在KDDCUP99数据集上进行检测,实验结果表明该算法具有较高的检测率及较低的误检率。  相似文献   

10.
针对海量数据背景下K-means聚类结果不稳定和收敛速度较慢的问题,提出了基于MapReduce框架下的K-means改进算法。首先,为了能获得K-means聚类的初始簇数,利用凝聚层次聚类法对数据集进行聚类,并用轮廓系数对聚类结果进行初步评价,将获得数据集的簇数作为K-means算法的初始簇中心进行聚类;其次,为了能适应于海量数据的聚类挖掘,将改进的K-means算法部署在MapReduce框架上进行运算。实验结果表明,在单机性能上,该方法具有较高的准确率和召回率,同时也具有较强的聚类稳定性;在集群性能上,也具有较好的加速比和运行速度。  相似文献   

11.
基于初始中心优化的遗传K-means聚类新算法   总被引:2,自引:2,他引:0  
一个好的K-means聚类算法至少要满足两个要求:(1)能反映聚类的有效性,即所分类别数要与实际问题相符;(2)具有处理噪声数据的能力。传统的K-means算法是一种局部搜索算法,存在着对初始化敏感和容易陷入局部极值的缺点。针对此缺点,提出了一种优化初始中心的K-means算法,该算法选择相距最远的处于高密度区域的k个数据对象作为初始聚类中心。实验表明该算法不仅具有对初始数据的弱依赖性,而且具有收敛快,聚类质量高的特点。为体现聚类的有效性,获得更高精度的聚类结果,提出了将优化的K-means算法(PKM)和遗传算法相结合的混合算法(PGKM),该算法在提高紧凑度(类内距)和分离度(类间距)的同时自动搜索最佳聚类数k,对k个初始中心优化后再聚类,不断地循环迭代,得到满足终止条件的最优聚类。实验证明该算法具有更好的聚类质量和综合性能。  相似文献   

12.
一种改进的遗传聚类算法   总被引:5,自引:0,他引:5       下载免费PDF全文
给出了一种改进的基于遗传算法的聚类方法。传统的K-means算法局部搜索能力强,但是对初始化比较敏感,容易陷入局部最优值。基本的基于遗传算法的聚类算法是一种全局优化算法,但是其局部搜索能力较差,收敛速度慢。针对这两个方法所存在的问题,提出了一种改进的聚类算法。该方法结合了两个方法的优点,引入了K-means操作,再用遗传算法进行优化,并且在该方法中改进了遗传算法中的交叉算子,大大提高了基于遗传算法的聚类算法的局部搜索能力和收敛速度。  相似文献   

13.
针对传统K均值聚类算法对初始化敏感和容易陷入局部最优的缺点,提出了一种基于扰动免疫粒子群和K均值的混合聚类算法。该算法采用K均值将粒子群进行分类,选择平均适应度值最高的聚类域用于产生疫苗,在粒子更新过程中采用疫苗接种机制和免疫选择机制提高粒子的多样性。当个体极值和全局极值连续停滞代数超过所设置的阀值时,算法使用扰动算子改变粒子群的运动方向,提高算法跳出局部极值的能力。当扰动次数达到设置的最大值时,对各个粒子进行K均值操作,提高收敛精度。实验结果表明,该算法具有较高的正确率和较好的稳定性。  相似文献   

14.
针对K-means、FMC聚类算法容易陷入局部最优且对初始解很敏感的问题,提出了一种新的基于划分和连接度的聚类优化算法,并给出了具体算法实现,明显地避免了对初始化选值敏感性的问题。给出了在KDDCUP99数据集上的检测结果,实验表明该算法具有较高的检测率及较低的误检率。  相似文献   

15.
骨架是指一个NP-难解问题实例的所有全局最优解的相同部分, 因其在启发式算法设计中的重要作用而成为该领域的研究热点. 本文对目前骨架及相关概念的研究成果进行了全面综述, 将骨架本身的研究工作归纳为三个层面: 理论基础层面主要考虑骨架与计算复杂性的关系问题; 应用基础层面主要考虑如何高效地获取骨架; 应用层面主要考虑如何利用骨架进行高效启发式算法设计. 在此基础上, 本文详细讨论了骨架研究亟待解决的难题, 并指出了解决这些问题的努力方向.  相似文献   

16.
针对K-means算法处理海量数据的聚类效果和速率,提出一种基于MapReduce框架下的K-means算法分布式并行化编程模型。首先对K-means聚类算法初始化敏感的问题,给出一种新的相异度函数,根据数据间的相异程度来确定k值,并选取相异度较小的点作为初始聚类中心,再把K-means算法部署在MapReduce编程模型上,通过改进MapReduce编程模型来加快K-means算法处理海量数据的速度。实验表明,基于MapReduce框架下改进的K-means算法与传统的K-means算法相比,准确率及收敛时间方面均有所提高,并且并行聚类模型在不同数据规模和计算节点数目上具有良好的扩展性。  相似文献   

17.
一种新的聚类算法--粒子群聚类算法   总被引:12,自引:0,他引:12  
在分析K均值聚类算法存在不足的基础上,该文提出了一种新的聚类算法:基于粒子群的K均值聚类算法。实验结果证明,该算法有很好的全局收敛性,不仅有效地克服了传统的k均值算法易陷入局部极小值和对初始值敏感的问题,而且具有较快的收敛速度。  相似文献   

18.
初始化K-means的谱方法   总被引:4,自引:0,他引:4  
众所周知, K-means (以下简称KM) 对初始点十分敏感. 本文提出了一种新的初始化KM 的方法, 它先估计出k个类的特征中心的位置, 然后用估计出的特征中心来初始化KM. 在人工数据集和真实数据集上的实验表明, 本文的方法所得到的结果要好于其他一些初始化KM 的方法.  相似文献   

19.
启发信息是地理信息系统(GIS)中的关键,针对蚁群算法易陷入局部最优的缺陷,提出一种带有启发信息的改进蚁群算法。i亥算法在初始化蚁群时引入启发信息指引蚂蚁快速收敛于全局最优解,为平衡全局与局部搜索能力,也改进状态转移概率算子,从而有效提高算法性能,增加种群多样性。实验以Visual Studi02005中C++编程实现仿真,结果表明此算法不但能有效求解GIS的最短路径,而且改进的算法能快速地收敛且精度高。  相似文献   

20.
改进的遗传算法求解旅行商问题   总被引:2,自引:0,他引:2  
提出一种解决旅行商问题的改进遗传算法.在传统遗传算法的基础上,引入贪婪算法进行种群初始化;从遗传进化代数和个体适应函数值两个方面实现遗传参数自适应调节,在加快寻优速度的同时防止寻优陷入局部最优;采用基于贪婪方法的启发式交叉算子优化交叉结果;对交叉前后的种群分别实施精英个体保留策略,保证最优基因结构得以延续.实验结果分析表明,改进的遗传算法可以在种群规模较小的情况下具有更可靠的寻优能力.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号