共查询到19条相似文献,搜索用时 187 毫秒
1.
2.
3.
4.
针对K-Means聚类算法依赖于初始聚类中心选择的问题,利用鲸鱼优化算法易于获取全局最优解及快速收敛性的优势,结合分布式框架的并行优势,提出了一种基于Flink的鲸鱼优化K-Means聚类算法。通过鲸鱼优化算法对领头鲸迭代更新、优化位置,用算法的最优解作为聚类中心替代K-Means算法的随机聚类中心,改进后的算法聚类效果较好、收敛速度快,有效结合了智能算法及分布式框架的优势。 相似文献
5.
遗传算法具有良好的全局搜索能力,但有过早收敛和过慢结束的缺点。K-Means算法具有很强的局部搜索能力,但算法有对初始聚类中心敏感而易陷入局部最优解。针对上述问题,提出了基于K-Means变异算子的混合遗传算法聚类,将K-Means算法的局部搜索能力与遗传算法的全局寻优搜索能力相结合,在遗传算法中引入K-Means变异算子,采用符号编码、自适应变异、最优个体保留策略的混合遗传算法。仿真实验表明,该算法有效克服了遗传算法过慢收敛和K-Means算法陷入局部收敛的问题,从而得到更好的聚类效果。 相似文献
6.
传统K-means算法对初始聚类中心的选取和样本的输入顺序非常敏感,容易陷入局部最优。针对上述问题,提出了一种基于遗传算法的K-means聚类算法GKA,将K-means算法的局部寻优能力与遗传算法的全局寻优能力相结合,通过多次选择、交叉、变异的遗传操作,最终得到最优的聚类数和初始质心集,克服了传统K-means算法的局部性和对初始聚类中心的敏感性。 相似文献
7.
图像分割和对象提取是从图像处理到图像分析的关键步骤。经典的模糊C-均值聚类算法(FCMA)是将图像分割成C类的常用方法,但依赖于初始聚类中心的选择。该算法通常得到的是局部最优解而非全局最优解。遗传算法是一类全局优化搜索算法。通过将遗传算法(GA)与FCMA相结合,对彩色地图直接按红绿蓝(RGB)三色空间进行聚类,用遗传算法搜索全局最优解,有效地避免了模糊C-均值聚类算法收敛到局部最优的问题,并在此基础上实现了对彩色地图的分割,得到了比较满意的效果。 相似文献
8.
针对K-Means聚类算法对初始聚类中心选择依赖性强的问题,利用狮群优化算法的快速收敛性及易于获取全局最优解的优势,提出了一种基于狮群优化的改进K-Means聚类算法。通过狮群优化算法对狮王不断迭代更新,优化狮王位置,将算法停止执行时的狮王最优解作为聚类中心,替代传统算法经过随机初始化得到具有不确定因素的聚类中心。选择UCI数据集进行验证,实验结果表明,改进算法的聚类效果较好,有效降低了K-Means对初始聚类中心的依赖。将改进的K-Means聚类算法应用于点云精简过程,获得了较好的点云精简效果。 相似文献
9.
10.
11.
12.
传统的K-Means聚类算法只能保证收敛到局部最优,从而导致聚类结果对初始代表点的选择非常敏感;凝聚层次聚类虽无需选择初始的聚类中心,但计算复杂度较高,而且凝聚过程不可逆。结合网络舆情的特点,深入剖析了K-Means聚类算法和凝聚层次聚类算法的优缺点,对K-Means聚类算法进行改进。改进后算法的核心思想是,结合两种算法分别在初始点选择和聚类过程两个方面的优势,进行整合优化。通过实验分析及实际应用表明,改进后的文本聚类算法在很大程度上可以提高网络舆情信息聚类结果的准确性、有效性以及算法的效率。 相似文献
13.
朱利华 《计算技术与自动化》2013,(4):57-60
为了克服经典K~Means算法随机选择初始数据中心而易陷入局部最优解和聚类结果的不确定性问题,提出一种基于粒子群和KMeans算法的改进聚类算法以实现移动用户分类。首先,定义数据对象密度并采用改进的普里姆算法初始化聚类中心,然后,将此聚类中心用于初始化粒子位置,采用混沌粒子群算法寻优获得最优解作为最终的聚类中心,最后,采用经典K—Means算法根据最终聚类中心进行聚类。仿真实验表明文中方法能正确地实现移动用户分类,并具有较强的全局寻优能力和较快的收敛速度,弥补了经典K—Means方法的不足,具有较强的现实意义。 相似文献
14.
15.
针对K-Means算法在文本聚类过程中易陷入局部最优,造成文本聚类结果不准确的问题,提出了一种基于改进灰狼优化算法的K-Means文本聚类方法。在对文本数据进行分词、去停用词、特征提取以及文本向量化后,通过免疫克隆选择选出精英个体,并对精英个体进行深度探索以增加灰狼种群的多样性,避免早熟收敛现象的发生;将粒子群位置更新思想与灰狼位置更新结合,降低灰狼优化算法陷入局部极值的风险;与K-Means算法结合进行文本聚类。所提算法与K-Means算法、GWO-KMeans以及IPSK-Means算法相比,其准确率、召回率和F值平均都有明显提高,文本聚类结果更可靠。 相似文献
16.
针对无监督聚类缺少数据分类等先验信息、基聚类的准确性受聚类算法影响以及一般聚类融合算法空间复杂度高的问题,提出一种基于改进遗传算法的聚类融合算法(CEIGA);同时针对传统聚类融合算法已经不能满足大规模数据处理对于时间的要求的问题,提出一种云计算下使用Hadoop平台的基于改进遗传算法的并行聚类融合算法(PCEIGA)。首先,基聚类生成机制产生的基聚类划分在完成簇标签转化后进行基因编码作为遗传算法的初始种群。其次,通过改进遗传算法的选择算子,保证基聚类的多样性;再根据改进的选择算子对染色体进行交叉和变异操作并使用精英策略得到下一代种群,保证基聚类的准确性。如此循环,使聚类融合最终结果达到全局最优,提高算法准确度。通过设计两个MapReduce过程并加入Combine过程减少节点通信,提高算法运行效率。最后,在UCI数据集上比较了CEIGA、PCEIGA和四个先进的聚类融合算法。实验结果表明,与先进的聚类融合算法相比,CEIGA性能最好;而PCEIGA能在不影响聚类结果准确度的前提下明显降低算法运行时间,提高算法效率。 相似文献
17.
An efficient hybrid algorithm based on modified imperialist competitive algorithm and K-means for data clustering 总被引:2,自引:0,他引:2
Taher Niknam Elahe Taherian FardNarges Pourjafarian Alireza Rousta 《Engineering Applications of Artificial Intelligence》2011,24(2):306-317
Clustering techniques have received attention in many fields of study such as engineering, medicine, biology and data mining. The aim of clustering is to collect data points. The K-means algorithm is one of the most common techniques used for clustering. However, the results of K-means depend on the initial state and converge to local optima. In order to overcome local optima obstacles, a lot of studies have been done in clustering. This paper presents an efficient hybrid evolutionary optimization algorithm based on combining Modify Imperialist Competitive Algorithm (MICA) and K-means (K), which is called K-MICA, for optimum clustering N objects into K clusters. The new Hybrid K-ICA algorithm is tested on several data sets and its performance is compared with those of MICA, ACO, PSO, Simulated Annealing (SA), Genetic Algorithm (GA), Tabu Search (TS), Honey Bee Mating Optimization (HBMO) and K-means. The simulation results show that the proposed evolutionary optimization algorithm is robust and suitable for handling data clustering. 相似文献
18.
Data clustering is related to the split of a set of objects into smaller groups with common features. Several optimization techniques have been proposed to increase the performance of clustering algorithms. Swarm Intelligence (SI) algorithms are concerned with optimization problems and they have been successfully applied to different domains. In this work, a Swarm Clustering Algorithm (SCA) is proposed based on the standard K-Means and on K-Harmonic Means (KHM) clustering algorithms, which are used as fitness functions for a SI algorithm: Fish School Search (FSS). The motivation is to exploit the search capability of SI algorithms and to avoid the major limitation of falling into locally optimal values of the K-Means algorithm. Because of the inherent parallel nature of the SI algorithms, since the fitness function can be evaluated for each individual in an isolated manner, we have developed the parallel implementation on GPU of the SCAs, comparing the performances with their serial implementation. The interest behind proposing SCA is to verify the ability of FSS algorithm to deal with the clustering task and to study the difference of performance of FSS-SCA implemented on CPU and on GPU. Experiments with 13 benchmark datasets have shown similar or slightly better quality of the results compared to standard K-Means algorithm and Particle Swarm Algorithm (PSO) algorithm. There results of using FSS for clustering are promising. 相似文献