共查询到19条相似文献,搜索用时 109 毫秒
1.
基于混合并行遗传算法的文本聚类研究 总被引:2,自引:0,他引:2
针对传统K-Means聚类算法对初始聚类中心的选择敏感,易陷入局部最优解的问题,提出一种基于混合并行遗传算法的文本聚类方法。该方法首先将文档集合表示成向量空间模型,并在文档向量中随机选择初始聚类中心形成染色体,然后结合K-Means算法的高效性和并行遗传算法的全局优化能力,通过种群内的遗传、变异和种群间的并行进化、联姻,有效地避免了局部最优解的出现。实验表明该算法相对于K-Means算法、简单遗传算法等文本聚类方法具有更高的精确度和全局寻优能力。 相似文献
2.
给出了一种改进的基于遗传算法的聚类方法。传统的K-means算法局部搜索能力强,但是对初始化比较敏感,容易陷入局部最优值。基本的基于遗传算法的聚类算法是一种全局优化算法,但是其局部搜索能力较差,收敛速度慢。针对这两个方法所存在的问题,提出了一种改进的聚类算法。该方法结合了两个方法的优点,引入了K-means操作,再用遗传算法进行优化,并且在该方法中改进了遗传算法中的交叉算子,大大提高了基于遗传算法的聚类算法的局部搜索能力和收敛速度。 相似文献
3.
针对K-均值聚类方法受初始聚类中心影响,容易陷入局部最优解的问题,提出一种基于量子粒子群算法的聚类方法,该方法引入了动态调整量子门旋转角和量子变异操作,采用改进的变异算子,使粒子群体保持品种的多样性和优良性,避免陷入局部最优,同时结合粒子群优化算法,增加粒子群的全局搜索能力。仿真实验表明该方法在全局寻优能力和收敛效率上都有所提高。 相似文献
4.
遗传算法可以较好地解决复杂的组合优化问题,但也存在两方面不足:一是搜索效率比其他优化算法低;二是容易过早收敛,陷入局部最优.对此,提出一种混沌“微变异”遗传算法.利用混沌优化算法具有随机性和遍历性的特点,解决遗传算法容易陷入局部最优解的早熟问题,使得新算法同时具有较强的局部搜索能力和完成全局寻找最优解的能力.同时,对遗传算法的选择算子增加了混沌扰动,对交叉算子和变异算子进行自适应调整,对适应度函数进行改进,使遗传算法整体性能得到提高.最后,通过经典函数验证表明,混沌“微变异”遗传算法比一般的混沌遗传算法和经典遗传算法的进化速度更快,搜索精度更高. 相似文献
5.
为提高正交遗传算法收敛速度和搜索精度,在正交遗传算法的基础上引入局部搜索策略,提出一种新的聚类局部搜索算子。利用正交算子初始化种群,保证初始群体分布的均匀性和多样性。通过正交算子在全局范围内进行全局搜索,使算法能在全局范围内收敛。采用聚类局部搜索算子对群体进行局部搜索,以增强算法的收敛速度和搜索精度。对7个高维的Benchmark函数进行测试,仿真实验结果表明,与其他算法相比,该算法具有更好的搜索精度、收敛速度和全局寻优的能力。 相似文献
6.
7.
为了解决聚类算法容易陷入局部最优的问题,以及增强聚类算法的全局搜索能力,基于KHM算法以及改进的引力搜索算法,本文提出一种混合K-调和均值聚类算法(G-KHM)。G-KHM算法具有KHM算法收敛速度快的优点,但同时针对KHM算法容易陷入局部最优解的问题,在初始化后数据开始搜索聚类中心时采用了一种基于对象多样性及收敛性增强的引力搜索算法,该方法改进了引力搜索算法容易失去种群多样性的缺点,并同时具有引力搜索算法较强的全局搜索能力,可以使算法收敛到全局最优解。仿真结果表明,G-KHM算法能有效地避免陷入局部极值,具有较强的全局搜索能力以及稳定性,并且相比KHM算法、K-mean聚类算法、C均值聚类算法以及粒子群算法,在分类精度和运行时间上表现出了更好地效果。 相似文献
8.
在分析和研究正交遗传算法的基础之上,依据混合优化策略及混合遗传算法的构造原则,通过对自适应正交局部搜索算子的改进提出了一种新的变异算子。该算子具备自适应全局搜索和局部搜索的能力,能够保证算法的变异概率取值为1.0时,算法的搜索效率最高;结合正交交叉算子之后,又能保证算法的交叉概率也取值为1.0时,算法的搜索效率最高;由此解决了交叉概率和变异概率参数的匹配问题。而使用的截断选择和负相关配对、最优交叉策略、精英选择和重复个体剔除策略等组合算子,一方面能够保证算法的收敛速度;另一方面也能有效地保持种群的多样性,这样在保证算法快速收敛的同时避免出现早熟现象;由此解决了"全局最优"和"快速收敛"的矛盾。因此,提出的改进型新算法在处理一些常用的测试函数上具有较高的效率。 相似文献
9.
针对k-means算法的聚类结果高度依赖初始聚类中心选取的问题,提出一种基于改进粒子群优化的文本聚类算法。分析粒子群算法和k-means算法的特点,针对粒子群算法搜索精度不高、易陷入局部最优且早熟收敛的缺点,设计自调节惯性权重机制及云变异算子以改进粒子群算法。自调节惯性权重机制根据种群进化程度,动态地调节惯性权重,云变异算子基于云模型的随机性和稳定性,采用全局最优值实现粒子的变异。该算法结合了粒子群算法较强的全局搜索能力与k-means算法较强的局部搜索能力。每个粒子是一组聚类中心,类内离散度之和的倒数是适应度函数。实验结果表明,该算法是一种精确而又稳定的文本聚类算法。 相似文献
10.
为增强萤火虫的全局探索能力和避免陷入局部最优,提出一种基于利维飞行和变异算子的萤火虫算法。采用标准萤火虫算法进行常规寻优,社会学习用于平衡全局搜索和局部探索能力。引入利维飞行策略,实现萤火虫的随机移动,避免萤火虫陷入局部最优。引入遗传算法中变异算子,扩大萤火虫的多样性。将该算法在广泛采用的15个基准函数上进行测试并与5种萤火虫算法进行比较,测试结果表明,该算法具有较高的准确率和较快的收敛速度。 相似文献
11.
12.
13.
14.
基于遗传算法的K均值聚类分析 总被引:11,自引:0,他引:11
1 前言聚类分析就是将数据对象分组成为多个类或簇,在同一个簇中的对象之间具有较高的相似度,而不同的簇中的对象差别较大。聚类分析目前应用广泛,已经成为数据挖掘主要的研究领域。通过聚类,人们能够识别密集的和稀疏的区域,从而发现数据的整体分布模式,还能找到数据间的有趣的相互关系。关于聚类分析目前已经有K均值,CURE等很多算法, 相似文献
15.
K-均值(K-Means)算法是聚类分析中一种基于划分的算法,同时也是无监督学习算法。其具有思想简单、效果好和容易实现的优点,广泛应用于机器学习等领域。但是K-Means算法也有一定的局限性,比如:算法中聚类数目K值难以确定,初始聚类中心如何选取,离群点的检测与去除,距离和相似性度量等。从多个方面对K-Means算法的改进措施进行概括,并和传统K-Means算法进行比较,分析了改进算法的优缺点,指出了其中存在的问题。对K-Means算法的发展方向和趋势进行了展望。 相似文献
16.
针对K-Means算法所存在的问题进行了深入研究,提出了基于密度的K-Means算法(KMAD算法)。该算法采用聚类对象区域空间的密度分布方法来确定聚类个数K的值,然后用高密度区域的质心作为K-Means算法的初始聚类中心。理论分析与实验结果表明了改进算法的有效性和稳定性,并将改进的算法应用于客户细分研究中。 相似文献
17.
18.
基于可变染色体长度的遗传K均值聚类算法 总被引:2,自引:2,他引:0
针对传统K-均值聚类算法需要事先确定聚类数,以及对初始质心的选择具有敏感性,从而容易陷入局部极值点的缺点,使用了一种基于可变染色体编码长度的遗传算法对传统K-均值聚类进行改进.该算法可以在事先不确定K值的情况下,通过多次的选择、交叉.变异的遗传操作,最终得到最优的聚类数,以及最优的初始质心集.通过Reuters数据集的实验结果表明,基于该算法的聚类划分结果明显优于传统K-均值聚类算法,并且好过基于固定染色体编码长度遗传算法的K-均值聚类算法. 相似文献
19.
针对遗传算法(GA)收敛结果不稳定、易陷入局部最优解等问题,提出了一种基于全局的改进双变异遗传算法(DMGA),并应用于图像的灰度阈值分割;分析了仿真初始参数对于图像分割结果的影响.实验结果表明:图像分割精度高,效果好,结果可靠,相对于传统GA,DMGA具有更好的全局和局部搜索能力,收敛结果稳定. 相似文献