首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 62 毫秒
1.
基于遗传算法的K均值聚类分析   总被引:11,自引:0,他引:11  
1 前言聚类分析就是将数据对象分组成为多个类或簇,在同一个簇中的对象之间具有较高的相似度,而不同的簇中的对象差别较大。聚类分析目前应用广泛,已经成为数据挖掘主要的研究领域。通过聚类,人们能够识别密集的和稀疏的区域,从而发现数据的整体分布模式,还能找到数据间的有趣的相互关系。关于聚类分析目前已经有K均值,CURE等很多算法,  相似文献   

2.
K调和均值算法(KHM)用数据点与所有聚类中心的距离的调和平均值替代了数据点与聚类中心的最小距离,是一种对初始值不敏感、收敛速度快的有效聚类算法,但它容易陷入局部最小值。而遗传算法具有良好的全局优化能力。文中结合了KHM和遗传算法各自的优点,采用KHM计算每一代种群的聚类中心,并构造适应度函数,通过遗传算法进行一系列择优操作,成功地解决了KHM容易陷入局部最小值的问题。实验结果表明,所提出的算法不仅优化了聚类中心,而且还改善了聚类质量。  相似文献   

3.
基于密度的改进K均值算法及实现   总被引:3,自引:1,他引:3  
傅德胜  周辰 《计算机应用》2011,31(2):432-434
传统的K均值算法的初始聚类中心从数据集中随机产生,聚类结果很不稳定。提出一种基于密度算法优化初始聚类中心的改进K-means算法,该算法选择相互距离最远的k个处于高密度区域的点作为初始聚类中心。实验证明,改进的K-means算法能够消除对初始聚类中心的依赖,聚类结果有了较大的改进。  相似文献   

4.
在K均值聚类算法中,K值需事先确定且在整个聚类过程中不能改变其大小,而按照经验K值划分所得的最终聚类结果一般并非最佳结果。通过求解所构造适应度函数的值,在变异操作中实现最佳聚类数K值的自动寻优,同时借助遗传操作完成聚类中心点的优化选取并利用遗传算法的全局寻优能力克服了K均值聚类算法的局部性。通过对Iris等数据集的实验分析,证明该算法具有良好的全局收敛性,且通过K值的自动调整,有效提高了聚类结果的划分。  相似文献   

5.
K调和均值算法(KHM)用数据点与所有聚类中心的距离的调和平均值替代了数据点与聚类中心的最小距离,是一种对初始值不敏感、收敛速度快的有效聚类算法,但它容易陷入局部最小值。而遗传算法具有良好的全局优化能力。文中结合了KHM和遗传算法各自的优点,采用KHM计算每一代种群的聚类中心,并构造适应度函数,通过遗传算法进行一系列择优操作,成功地解决了KHM容易陷入局部最小值的问题。实验结果表明,所提出的算法不仅优化了聚类中心,而且还改善了聚类质量。  相似文献   

6.
基于遗传算法的聚类分析   总被引:39,自引:2,他引:39  
给出了一种基于遗传算法的聚类分析方法。采用二进制编码方式对聚类的中心进行编码,并用特征向量与相应聚类中心的欧氏距离的和来判断聚类划分的质量,通过选择、交叉和变异操作对聚类中心的编码进行优化,得到便聚类划分效果最好的聚类中心。实验结果显示,该方法的聚类划分效果明显优于传统的K-均值方法。  相似文献   

7.
一种改进的遗传K-均值聚类算法   总被引:1,自引:0,他引:1  
文章提出一种基于改进遗传算法的K-均值聚类算法。主要对算法遗传算子进行改进:交叉操作通过交换两条染色体问的聚类中心进行重组,将一次K-均值方法当作变异操作,并加入跨世代精英选择机制。通过实验证明:该算法比传统的K-均值算法具有较好的性能,同时比其他基于遗传算法的K-均值算法具有更高的效率且更适用于规模较大的数据集。  相似文献   

8.
模糊C均值主要考虑距离函数,即点与点之间的关系。在样本集中,不同样本点对于聚类的影响不同,加权模糊C均值通过对点本身加权来体现这一点。(加权)模糊C均值对初始中心敏感,且容易陷入局部最优;而遗传算法则是全局最优。所以,将二者的思想结合,利用遗传算法得到初始聚类中心,再用加权模糊C均值进行分类,可以得到更好的聚类效果。  相似文献   

9.
K均值算法虽被广泛应用,但其算法性能和算法稳定性严重依赖算法的初始化过程,尤其是初始聚类中心的选取。比较合理的聚类中心应该出现在数据密集的区域,基于这个假设,提出了一种依赖数据局部密度的初始化调优算法。该算法以数据的局部密度函数为依据,并在高密度区域选取初始聚类中心。与同类算法相比,该算法有如下特点:能够自主发现数据集中数据分布的局部密集度;对类别数目较多的数据表现出更好的性能;对离群点和噪声鲁棒;易于实现。  相似文献   

10.
基于遗传算法的聚类分析在CT图像分割中的应用   总被引:2,自引:0,他引:2  
针对CT医学图像的特点,本文将遗传算法与聚类分析两种工具相结合,应用到医学CT图像分割中。对K均值聚类做了简要分析和评论,在此基础上将遗传算法引入聚类分析中,利用遗传算法搜索的随机性和并行性,从而克服了K均值聚类的局部性和对初始聚类中心的敏感性;并且可以根据分割的要求,合理地调整聚类时的特征向量和权重。试验结果表明上述方法是可行的,达到了较好的分割效果。  相似文献   

11.
K-Means聚类算法研究综述   总被引:2,自引:0,他引:2       下载免费PDF全文
K-均值(K-Means)算法是聚类分析中一种基于划分的算法,同时也是无监督学习算法。其具有思想简单、效果好和容易实现的优点,广泛应用于机器学习等领域。但是K-Means算法也有一定的局限性,比如:算法中聚类数目K值难以确定,初始聚类中心如何选取,离群点的检测与去除,距离和相似性度量等。从多个方面对K-Means算法的改进措施进行概括,并和传统K-Means算法进行比较,分析了改进算法的优缺点,指出了其中存在的问题。对K-Means算法的发展方向和趋势进行了展望。  相似文献   

12.
K-Means聚类算法的结果质量依赖于初始聚类中心的选择。该文将局部搜索的思想引入K-Means算法,提出一种改进的KMLS算法。该算法对K-Means收敛后的结果使用局部搜索来使其跳出局部极值点,进而再次迭代求优。同时对局部搜索的结果使用K-Means算法使其尽快到达一个局部极值点。理论分析证明了算法的可行性和有效性,而在标准文本集上的文本聚类实验表明,相对于传统的K-Means算法,该算法改进了聚类结果的质量。  相似文献   

13.
一种基于网格的改进的K-Means聚类算法   总被引:1,自引:0,他引:1  
K-Means算法对数据集中的每个数据点进行多次处理,因此对于大数据集时间效率不高.为提高K-Means算法的时间性能并使聚类结果更优,利用网格方法定义了单元密度聚合度概念,提出了一种基于网格的改进的K-Means聚类算法(IKMG).IKMG利用网格连通性原理并借助树形结构,将多个密集网格单元作为初始根节点,周围网格作为它的子节点,以此类推,广度优先扩展树最终得到K个聚类树.实验结果表明,IKMG不但大大缩短了K-Means算法对大数据集的处理时间,而且能有效消除聚类结果对初始聚类中心的敏感性,无需人为指定K值,能找出不同大小、不同形状的聚类.  相似文献   

14.
王宏杰  师彦文 《计算机科学》2017,44(Z11):457-459, 502
为了提高传统K-Means聚类算法的聚类准确性,提出一种结合初始中心优化和特征加权的改进K-Means聚类算法。首先,根据样本特征对聚类的贡献程度获得初始特征权重,构建一种加权距离度量。其次,利用提出的初始聚类中心选择方法获得k个初始聚类中心,并结合初始特征权重进行初步聚类。然后,根据聚类精度来调整特征权重并再次执行聚类过程。重复执行上述过程直到聚类精度不再变化,获得最终的聚类结果。在UCI数据库上的实验结果表明,与现有相关K-Means聚类算法相比,该算法具有较高的聚类准确性。  相似文献   

15.
针对高分辨率天文图像中的星点聚类研究中存在的 2 个问题:①天文图像的分辨率 较高,且图像处理速度较慢;②选取何种聚类算法对天文图像中的星点进行聚类分析效果较好。 在研究中,问题 1 采用图像分块的方法提高图像的处理速度;问题 2 提出了一种改进的 K 均值聚 类算法,以解决传统的 K 均值聚类算法的聚类结果易受到 k 值和初始聚类中心随机选择影响的问 题。该算法首先在用 K 均值聚类算法对数据初步聚类的基础上确定合适的 k 值,其次用层次聚类 对数据聚类确定初始聚类中心,最后在此基础上再采用 K 均值聚类算法进行聚类。通过 MATLAB 仿真实验的结果表明,该算法的聚类结果与效率优于其他聚类算法。  相似文献   

16.
针对K-Means算法在文本聚类过程中易陷入局部最优,造成文本聚类结果不准确的问题,提出了一种基于改进灰狼优化算法的K-Means文本聚类方法。在对文本数据进行分词、去停用词、特征提取以及文本向量化后,通过免疫克隆选择选出精英个体,并对精英个体进行深度探索以增加灰狼种群的多样性,避免早熟收敛现象的发生;将粒子群位置更新思想与灰狼位置更新结合,降低灰狼优化算法陷入局部极值的风险;与K-Means算法结合进行文本聚类。所提算法与K-Means算法、GWO-KMeans以及IPSK-Means算法相比,其准确率、召回率和F值平均都有明显提高,文本聚类结果更可靠。  相似文献   

17.
对教学反思内容的准确评估是教师基于教学反思过程提升其专业能力的重要保障。基于改进的K-Means算法对相同主题的教学反思文本进行聚类,通过给定初始聚类中心K的取值范围使其可以在给定范围内自动增加,在聚类过程中加入相似度阈值以限定文本间相似度的取值范围,实现对教学反思文本的分类和对自我反思文本的定位。实验结果表明改进的K—Means算法在反思文本聚类的准确率和稳定性方面比传统算法有所提高,且能根据教学反思内容准确地进行自动分类。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号