共查询到20条相似文献,搜索用时 93 毫秒
1.
2.
K-means聚类算法的研究综述 总被引:2,自引:0,他引:2
K-均值聚类算法(K-means)是基于划分的聚类算法中的典型算法,针对K-means算法初始聚类中心存在对K依赖的缺陷,提出一种新的选取K-means算法初始聚类中心的方法,该方法提高聚类结果的有效性和稳定性;还提出一种极值选择法,将最大距离法和最小距离法相结合,进一步提高初始聚类中心选择的准确性。 相似文献
3.
4.
基于免疫遗传的K-Means聚类算法分析 总被引:1,自引:1,他引:1
聚类算法是数据挖掘中的一个重要研究领域,在所有的聚类算法中K.Means算法应用得最为广泛.针对K-Means算法容易陷入局部最优解的缺点,提出了基于免疫遗传的K-Means聚类算法来避免这个问题.理论分析和实验表明,该算法比传统的K-Means聚类有更好的效果. 相似文献
5.
免疫规划+K均值混合聚类算法 总被引:2,自引:0,他引:2
1.引言聚类分析(Clustering Analysis)是一种无监督的模式识别方法。聚类产生的每一组数据称为一个簇,簇中的每一数据称为一个对象。聚类的目的是使同一簇中对象的特性尽可能地相似,而不同簇对象间的特性差异尽可能地大。聚类的任务是把一个未标记的模式按某种准则划分成若干子集,要求相似的样本尽量归为同一类,而不相似的样本归为不同的类,故又称无监督分类。目前,各种聚类方法已广泛应用于数据挖 相似文献
6.
聚类分析是一种重要的数据挖掘方法。K-means聚类算法在数据挖掘领域具有非常重要的应用价值。针对K-means需要人工设定聚类个数并且易陷入局部极优的缺陷,提出了一种基于最近共享邻近节点的K-means聚类算法(KSNN)。KSNN在数据集中搜索中心点,依据中心点查找数据集个数,为K-means聚类提供参数。从而克服了K-means需要人工设定聚类个数的问题,同时具有较好的全局收敛性。实验证明KSNN算法比K-means、粒子群K-means(pso)以及多中心聚类算法(MCA)有更好的聚类效果。 相似文献
7.
一种改进的K-means聚类算法 总被引:4,自引:0,他引:4
王燕 《计算机应用与软件》2004,21(10):122-123
本文提出了一种改进的K-means算法(FKN)。此算法将传统算法任意选取初始聚类中心变为选取出现频率最高的一组颜色作为初始聚类中心,从而极大地提高了K-means的速度。通过实验证明了FKN较K-means有较低的时间复杂性及较低的颜色平均误差。 相似文献
8.
基于免疫单亲遗传和模糊C均值的聚类算法 总被引:6,自引:0,他引:6
聚类算法是数据挖掘中的重要方法。为了克服FCM初始值敏感、客易陷入局部最优解以及普通遗传算法聚类时的搜索速度和聚类精度的矛盾,在分析FCM算法和基于道传聚类算法的不足基础上,提出了一种基于免疫单亲遗传和模糊C均值的混合聚类算法,先以免疫单亲遗传聚类算法初始化,找到接近全局的最优解,再用FCM算法进行求解。实验表明,它既较好地解决了局部最优问题,又可以利用FCM的优点来提高整体的收敛速度。 相似文献
9.
一种改进的K-means聚类算法 总被引:1,自引:0,他引:1
本文提出了一种带离群点数据过滤的K-means改进算法。该算法根据离群点数据特征制定了离群点数据的发现规则,并在原算法中加入了离群点数据的发现和处理步骤。通过对给定的具有普遍意义的数据实验表明,改进后算法能较为稳定的发现数据集中存在的离群点数据,这些离群点数据符合离群点数据特征;同时在剔除这些极少数离群点数据后,显著提高了聚类结果簇的凝聚度,从而有效克服了离群点数据对K-means算法的影响,使聚类效果得以显著提高。 相似文献
10.
介绍了K-means算法的思想,分析了在文档聚类中运用K-means算法的步骤。以开源的机器学习软件Weka为平台,详细论述在Weka上进行文档聚类的前端处理过程,利用搜狗语料库中的文档在Weka上进行了Kmeans算法的聚类测试。实验结果表明,K-means算法在Web文档聚类中表现出较好的效果。根据实验结果,分析了K-means算法存在的不足和聚类分析中特征选择的重要性。 相似文献
11.
一种新的聚类算法--粒子群聚类算法 总被引:12,自引:0,他引:12
在分析K均值聚类算法存在不足的基础上,该文提出了一种新的聚类算法:基于粒子群的K均值聚类算法。实验结果证明,该算法有很好的全局收敛性,不仅有效地克服了传统的k均值算法易陷入局部极小值和对初始值敏感的问题,而且具有较快的收敛速度。 相似文献
12.
改进遗传算法的K-均值聚类算法研究 总被引:2,自引:0,他引:2
传统的k-均值算法对初始聚类中心的敏感很大,极易陷入局部最优值;利用遗传算法或免疫规划算法解决初始聚类中心是较好的方法,但后期容易出现收敛速度缓慢.为了克服上述缺点,文章将免疫原理的选择操作机制引入遗传算法中,使个体浓度和适应度同时对个体的选择施加影响,以此提出基于改进遗传算法的K-均值聚类算法,该方法利用K-均值算法的高效性和改进遗传算法的全局优化搜索能力,较好地解决了聚类中心优化问题.试验结果表明,本算法能够有效改善聚类质量,并且具有较好的收敛速度. 相似文献
13.
提出了一种基于免疫规划K-均值聚类算法的电梯交通流模式识别新方法,以该系统前7 d的交通流数据为样本,采用免疫k-均值算法对其进行聚类分析,产生的类别对应交通流模式,将实时采样数据划分到交通流模式对应的类中,能够识别25种交通流模式;实验表明该方法识别电梯交通流模式正确率高,可以指导系统优化派梯策略,算法的收敛速度较快,能够满足群控系统的实时性要求. 相似文献
14.
一种新型的自适应人工免疫算法 总被引:8,自引:2,他引:8
论文简略叙述了免疫系统的基本原理,并对两种典型的免疫算法aiNet和RLAIS进行了详细分析,进而提出了一种新型的自适应人工免疫网络算法用于离散数据的聚类分析。此算法能得到稳定和良好的聚类结果,并能达到用户要求的数据压缩比,另外需用户确定的控制参数很少。 相似文献
15.
K-means算法是聚类分析中的一种经典算法,但是K-means算法是一种局部搜索技术,受初始聚类中心的影响可能会过早收敛于最优解.而遗传算法具有良好的全局优化的能力,将遗传算法与K-means算法结合起来,能很好解决这一问题.在结合的过程中,又在最传统的遗传算法中改进染色体编码与适应度函数,从而优化k个中心点的选取,... 相似文献
16.
为了在聚类数不明确的情况下实现聚类分析,提出一种新的结合最近邻聚类和遗传算法的动态聚类算法.新算法包括两个阶段:第一阶段用最近邻聚类算法根据最近邻方法把最相似的实例分到同一个簇中并根据一些相似性或相异性度量过滤掉噪声数据从而得到初始聚类集,第二阶段是遗传优化阶段,利用动态聚类评估函数,动态地合并初始聚类集,从而获得接近最优的解.最后对算法进行了实验仿真,实验结果表明方法在事先不知道聚类数的情况下能够有效地进行聚类. 相似文献
17.
18.
基于优化初始中心点的K-means文本聚类算法 总被引:1,自引:0,他引:1
张世博 《计算机与数字工程》2011,(10):30-31
K-means算法终止于一个局部最优状态,所以初始中心点的选择会在很大程度上影响其聚类效果.该文针对K-means算法所存在的问题,提出了一种优化初始中心点的算法.实验表明可以有效减少迭代次数并提高聚类精度,最终获得较好的聚类效果. 相似文献
19.
20.
一种基于人工免疫原理的混合聚类算法 总被引:1,自引:0,他引:1
通过借鉴生物免疫系统中的克隆选择原理和记忆机制,提出了一种基于人工免疫原理的混合聚类算法.该算法引入了记忆抗体的分化和抑制机制,可有效地摆脱局部最优点;同时还集成了K-均值搜索算子,用于加快收敛速度.与K-均值方法比较,其具有更快的收敛速度和更高的收敛精度.仿真结果表明,所提算法是有效的. 相似文献