首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 156 毫秒
1.
改进遗传算法的K-均值聚类算法研究   总被引:2,自引:0,他引:2  
传统的k-均值算法对初始聚类中心的敏感很大,极易陷入局部最优值;利用遗传算法或免疫规划算法解决初始聚类中心是较好的方法,但后期容易出现收敛速度缓慢.为了克服上述缺点,文章将免疫原理的选择操作机制引入遗传算法中,使个体浓度和适应度同时对个体的选择施加影响,以此提出基于改进遗传算法的K-均值聚类算法,该方法利用K-均值算法的高效性和改进遗传算法的全局优化搜索能力,较好地解决了聚类中心优化问题.试验结果表明,本算法能够有效改善聚类质量,并且具有较好的收敛速度.  相似文献   

2.
基于可变染色体长度的遗传K均值聚类算法   总被引:2,自引:2,他引:0  
针对传统K-均值聚类算法需要事先确定聚类数,以及对初始质心的选择具有敏感性,从而容易陷入局部极值点的缺点,使用了一种基于可变染色体编码长度的遗传算法对传统K-均值聚类进行改进.该算法可以在事先不确定K值的情况下,通过多次的选择、交叉.变异的遗传操作,最终得到最优的聚类数,以及最优的初始质心集.通过Reuters数据集的实验结果表明,基于该算法的聚类划分结果明显优于传统K-均值聚类算法,并且好过基于固定染色体编码长度遗传算法的K-均值聚类算法.  相似文献   

3.
针对模糊C均值(FCM)聚类算法具有初始聚类中心敏感和容易陷入局部最优的问题,提出了一种基于改进遗传算法(GA)的加权模糊c均值聚类算法,采用高斯变异算子,提高了遗传算法在每个峰值附近的局部搜索能力,用基于复相关系数的加权欧式距离代替欧式距离,改进了FCM算法的聚类目标函数.用改进的算法对国际标准测试数据Iris进行测试,实验结果表明改进后的算法具有更好的稳定性和健壮性,提高了聚类的效果.  相似文献   

4.
全局K-均值聚类算法需要随机选取初始的聚类中心,本文基于K中心点算法的思想,将其作为全局K-均值聚类算法的初始聚类中心,并对全局K-均值聚类算法进行改进。依托人工模拟数据和学习库中的数据分析,对比两种算法的性能,得出改进算法聚类时间短,鲁棒性强的结论。  相似文献   

5.
基于密度加权的粗糙K-均值聚类改进算法   总被引:8,自引:1,他引:7  
针对粗糙K-均值聚类算法中类均值计算式的特点,提出了一种改进的粗糙K-均值算法.改进后的算法基于数据对象所在区域的密度,在类的均值计算过程中对每个对象赋以不同的权重.不同测试数据集的实验结果表明,改进后的粗糙K-均值算法提高了聚类的准确性,降低了迭代次数,并且可以有效地减小孤立点对聚类的影响.  相似文献   

6.
一种基于遗传算法的聚类方法及其应用   总被引:1,自引:0,他引:1  
吴月娴  葛临东  许志勇  薛富强 《计算机仿真》2007,24(11):182-184,189
文中提出了一种基于遗传算法的自适应聚类新算法,该算法以聚类中心坐标为遗传算法种群的个体,采用改进的遗传算子和群体更新规则,利用遗传算法的高效全局搜索特性实现聚类,不仅克服了模糊C-均值算法对初始聚类中心和样本输入次序敏感等不足,而且在结合聚类有效性分析的基础上实现了聚类中心数目的自适应调整.通过以该自适应聚类算法对MQAM信号星座进行重构,提出了一种基于星座聚类的MQAM调制识别新方法.仿真表明,文中提出的聚类算法运算效率较高,结果令人满意;基于该聚类算法的MQAM信号识别方法是实际有效的.  相似文献   

7.
基于伪并行遗传算法的聚类分析方法   总被引:1,自引:0,他引:1  
针对传统的基于聚类准则的聚类算法初始化敏感和容易陷入局部极值的问题,设计了一种新的基于伪并行遗传算法的聚类方法.采用实数编码方式对每个样本所属的类别进行编码,通过空类的识别和修复来修正不舍法的染色体.在引入离散随机变异算子和优化方向变异算子的基础上,结合迁移策略和插入策略,达到兼顾局部收敛速度和全局收敛性能的目的.与K-均值算法对比仿真实验,表明了这种基于伪并行遗传算法的聚类新方法的可行性和有效性.  相似文献   

8.
针对K-调和均值聚类算法易陷入局部最优的缺点,提出了一种基于改进差分进化的K-调和均值聚类算法。该算法通过引入基于Logistic变尺度混沌搜索和指数递增交叉概率算子的差分进化算法来增强全局寻优能力。实验结果表明,该算法能够较好地克服K-调和均值算法的缺点,在保证收敛速度的同时增强了算法的全局搜索能力。  相似文献   

9.
K-均值聚类是一种被广泛应用的方法。本文提出了基于K-均值聚类的改进算法,并应用于图像分割。针对K-均值聚类算法对离群点的反应过强的缺点,通过替换中心点,比较代价函数,来达到改进划分结果的目的。实验结果表明,该方法能有效改善聚类中心,提高分类精度和准确性。  相似文献   

10.
K-均值聚类是一种被广泛应用的方法。本文提出了基于K-均值聚类的改进算法,并应用于图像分割。针对K-均值聚类算法对离群点的反应过强的缺点,通过替换中心点,比较代价函数,来达到改进划分结果的目的。实验结果表明,该方法能有效改善聚类中心,提高分类精度和准确性。  相似文献   

11.
针对K-means算法易受初始聚类中心影响而陷入局部最优的问题,提出一种基于萤火虫智能优化和混沌理论的FCMM算法。首先利用最大最小距离算法确定聚类类别值K和初始聚类中心位置;然后以各聚类中心为基准点,利用Tent映射构建混沌空间,通过混沌搜索更新聚类中心,以降低初始聚类中心过于临近的影响,并改善算法易陷入局部最优的问题。仿真结果表明,FCMM算法的平均聚类精度相较于经典K-means算法和FA算法分别提高了7.51%和2.2%,成功避免算法陷入局部最优解,提高了划分初始数据集的效率和寻优精度。  相似文献   

12.
一种基于广度优先搜索的K-means初始化算法   总被引:1,自引:0,他引:1       下载免费PDF全文
K-means算法是在现实应用中非常广泛的聚类算法,K-means算法对初始中心的选择非常敏感,对已存在的有代表性的初始算法进行了研究,提出了一种基于广度优先搜索的K-means初始化算法。该算法综合考虑了密度与距离因素,选择初始点。分析表明该算法选择的初始点非常接近期望的中心点。  相似文献   

13.
K-means type clustering algorithms for mixed data that consists of numeric and categorical attributes suffer from cluster center initialization problem. The final clustering results depend upon the initial cluster centers. Random cluster center initialization is a popular initialization technique. However, clustering results are not consistent with different cluster center initializations. K-Harmonic means clustering algorithm tries to overcome this problem for pure numeric data. In this paper, we extend the K-Harmonic means clustering algorithm for mixed datasets. We propose a definition for a cluster center and a distance measure. These cluster centers and the distance measure are used with the cost function of K-Harmonic means clustering algorithm in the proposed algorithm. Experiments were carried out with pure categorical datasets and mixed datasets. Results suggest that the proposed clustering algorithm is quite insensitive to the cluster center initialization problem. Comparative studies with other clustering algorithms show that the proposed algorithm produce better clustering results.  相似文献   

14.
针对K-means算法中的初始聚类中心是随机选择这一缺点进行改进,利用提出的新算法选出初始聚类中心,并进行聚类。这种算法比随机选择初始聚类中心的算法性能有所提高,具有更高的准确性。  相似文献   

15.
提出一种新的选取初始聚类中心的算法,该算法结合了凝聚层次聚类算法AGNES,利用该算法选出初始聚类中心,再应用到K-means算法中进行聚类。实验表明,改进的算法聚类效果更好,准确率得到了提高,迭代次数也明显减少,还能够发现异常点。  相似文献   

16.
基于密度的改进K均值算法及实现   总被引:4,自引:1,他引:3  
傅德胜  周辰 《计算机应用》2011,31(2):432-434
传统的K均值算法的初始聚类中心从数据集中随机产生,聚类结果很不稳定。提出一种基于密度算法优化初始聚类中心的改进K-means算法,该算法选择相互距离最远的k个处于高密度区域的点作为初始聚类中心。实验证明,改进的K-means算法能够消除对初始聚类中心的依赖,聚类结果有了较大的改进。  相似文献   

17.
公路运输的发展有效促进了我国经济持续、快速的发展,但公路建设和运输枢纽建设呈现出不平衡性。因此需采用聚类分析对公路主枢纽城市进行聚类,划分层次来进行功能分析。K-means算法是聚类分析中使用最为广泛的算法之一,但算法具有初始中心点和聚类个数不确定等方面的缺点。针对其缺点,提出将基于蚁群算法的K-means算法应用于在公路运输枢纽布局规划中。实验结果表明,与单独使用两种算法相比,该算法更能有效地解决公路主枢纽城市的聚类问题。  相似文献   

18.
传统的K-means算法敏感于初始中心点的选取,并且无法事先确定准确的聚类数目[k],不利于聚类结果的稳定性。针对传统K-means算法的以上不足,提出了基于全局中心的高密度不唯一的新方法--NDK-means,该方法通过标准差确定有效密度半径,并从高密度区域中选取具有代表性的样本点作为初始聚类中心。此外算法针对最高密度点不唯一的情况进行特别分析,选取距离全局中心最远的点集作为最优的初始中心点集合。在NDK-means算法基础上结合有效性指标BWP对聚类结果进行分析,从而解决了最佳有效聚类数目无法事先确定的不足。理论研究与实验结果表明所提方法的聚类结果具有更好的稳定性和可行性。  相似文献   

19.
基于密度的K-means聚类中心选取的优化算法   总被引:2,自引:0,他引:2  
针对传统的K-means算法对于初始聚类中心点和聚类数的敏感问题,提出了一种优化初始聚类中心选取的算法。该算法针对数据对象的分布密度以及计算最近两点的垂直中点方法来确定k个初始聚类中心,再结合均衡化函数对聚类个数进行优化,以获得最优聚类。采用标准的UCI数据集进行实验对比,发现改进后的算法相比传统的算法有较高的准确率和稳定性。  相似文献   

20.
一种改进的遗传K-均值聚类算法   总被引:1,自引:0,他引:1  
文章提出一种基于改进遗传算法的K-均值聚类算法。主要对算法遗传算子进行改进:交叉操作通过交换两条染色体问的聚类中心进行重组,将一次K-均值方法当作变异操作,并加入跨世代精英选择机制。通过实验证明:该算法比传统的K-均值算法具有较好的性能,同时比其他基于遗传算法的K-均值算法具有更高的效率且更适用于规模较大的数据集。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号