首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
王秋萍  丁成  王晓峰 《控制与决策》2020,35(10):2449-2458
为解决K-means聚类对初始聚类中心敏感和易陷入局部最优的问题,提出一种基于改进磷虾群算法与K-harmonic means的混合数据聚类算法.提出一种具有莱维飞行和交叉算子的磷虾群算法以改进磷虾群算法易陷入局部极值和搜索效率低的不足,即在每次标准磷虾群位置更新后加入新的位置更新方法进一步搜索以提高种群的搜索能力,同时交替使用莱维飞行与交叉算子对当前群体位置进行贪婪搜索以增强算法的全局搜索能力. 20个标准测试函数的实验结果表明,改进算法不易陷入局部最优解,可在较少的迭代次数下有效地搜索到全局最优解的同时保证算法的稳定性.将改进的磷虾群算法与K调和均值聚类融合,即在每次迭代后用最优个体或经过K调和均值迭代一次后的新个体替换最差个体. 5个UCI真实数据集的测试结果表明:融合后的聚类算法能够克服K-means对初始聚类中心敏感的不足且具有较强的全局收敛性.  相似文献   

2.
针对磷虾群(KH)算法在寻优过程中因种群多样性降低而过早收敛的问题,提出基于广义反向学习的磷虾群算法GOBL-KH。首先,通过余弦递减策略确定步长因子平衡算法的探索与开发能力;然后,加入广义反向学习策略对每个磷虾进行广义反向搜索,增强磷虾探索其周围邻域空间的能力。将改进的算法在15个经典测试函数上进行测试并与KH算法、步长线性递减的磷虾群(KHLD)算法和余弦递减步长的磷虾群(KHCD)算法比较,实验结果表明:GOBL-KH算法可有效避免早熟且具有较高的求解精度。为体现算法有效性,将GOBL-KH算法与K均值算法结合提出HK-KH算法用于解决数据聚类问题,即在每次迭代后用最优个体或经过K均值迭代一次后的新个体替换最差个体,使用UCI五个真实数据集进行测试并与K均值、遗传算法(GA)、粒子群优化(PSO)算法、蚁群算法(ACO)、KH算法、磷虾群聚类算法(KHCA)、改进磷虾群(IKH)算法进行比较,结果表明:HK-KH算法适用于解决数据聚类问题且具有较强的全局收敛性和较高的稳定性。  相似文献   

3.
利用粒子群优化(PSO)算法全局寻优的特点,很大程度上避免了模糊C-均值聚类(FCM)算法对初值敏感、易陷入局部收敛的缺陷.利用收敛速度快的K均值聚类法得到的聚类中心作为PSO算法初始聚类中心的参考,提出一种新的模糊C-均值聚类算法Improved PSO FCM.实验结果表明,论文算法提高了FCM的搜索能力,聚类更为准确,效率更高.  相似文献   

4.
文本信息中包括许多无用特征,这种噪声特征会影响文本聚类效果,为此提出一种基于粒子群优化的文本特征选择算法.利用词频逆文本频率指数为目标函数评估每个文档的文本特征,从初始文档数据集中求解新的有用特征最优子集;以该最优有用特征子集作为K均值聚类的输入进行文本聚类,得到最优文本聚类结果.利用文档数据集进行聚类测试,其结果表明...  相似文献   

5.
针对k-means算法的聚类结果高度依赖初始聚类中心选取的问题,提出一种基于改进粒子群优化的文本聚类算法。分析粒子群算法和k-means算法的特点,针对粒子群算法搜索精度不高、易陷入局部最优且早熟收敛的缺点,设计自调节惯性权重机制及云变异算子以改进粒子群算法。自调节惯性权重机制根据种群进化程度,动态地调节惯性权重,云变异算子基于云模型的随机性和稳定性,采用全局最优值实现粒子的变异。该算法结合了粒子群算法较强的全局搜索能力与k-means算法较强的局部搜索能力。每个粒子是一组聚类中心,类内离散度之和的倒数是适应度函数。实验结果表明,该算法是一种精确而又稳定的文本聚类算法。  相似文献   

6.
K均值算法是一种常用的基于原型的聚类算法。但该算法要求用户随机选择初始质心,使得K均值算法受初始化影响较大。二分K均值算法虽然改善了这个问题,但仍然要求用户指定聚类个数,影响了聚类效果。用层次聚类对二分法进行改进,解决了二分K均值算法受用户指定的聚类个数的影响的问题。并结合Chameleon算法,合并划分过细簇,优化聚类结果。仿真实验证明改进的聚类算法的抱团性和分离性优于二分K均值聚类算法。  相似文献   

7.
对教学反思内容的准确评估是教师基于教学反思过程提升其专业能力的重要保障。基于改进的K-Means算法对相同主题的教学反思文本进行聚类,通过给定初始聚类中心K的取值范围使其可以在给定范围内自动增加,在聚类过程中加入相似度阈值以限定文本间相似度的取值范围,实现对教学反思文本的分类和对自我反思文本的定位。实验结果表明改进的K—Means算法在反思文本聚类的准确率和稳定性方面比传统算法有所提高,且能根据教学反思内容准确地进行自动分类。  相似文献   

8.
针对传统K均值聚类方法采用聚类前随机选择聚类个数K而导致的聚类结果不理想的问题,结合空间中的层次结构,提出一种改进的层次K均值聚类算法。该方法通过初步聚类,判断是否达到理想结果,从而决定是否继续进行更细层次的聚类,如此迭代执行,从而生成一棵层次型K均值聚类树,在该树形结构上可以自动地选择聚类的个数。标准数据集上的实验结果表明,与传统的K均值聚类方法相比,提出的改进的层次聚类方法的确能够取得较优秀的聚类效果。  相似文献   

9.
针对高分辨率天文图像中的星点聚类研究中存在的 2 个问题:①天文图像的分辨率 较高,且图像处理速度较慢;②选取何种聚类算法对天文图像中的星点进行聚类分析效果较好。 在研究中,问题 1 采用图像分块的方法提高图像的处理速度;问题 2 提出了一种改进的 K 均值聚 类算法,以解决传统的 K 均值聚类算法的聚类结果易受到 k 值和初始聚类中心随机选择影响的问 题。该算法首先在用 K 均值聚类算法对数据初步聚类的基础上确定合适的 k 值,其次用层次聚类 对数据聚类确定初始聚类中心,最后在此基础上再采用 K 均值聚类算法进行聚类。通过 MATLAB 仿真实验的结果表明,该算法的聚类结果与效率优于其他聚类算法。  相似文献   

10.
刘衍民  牛奔  赵庆祯 《计算机工程》2011,37(14):152-154
为更有效地求解多目标优化问题,提出一种基于均匀设计的聚类多目标粒子群算法UCMOPSO。采用基于均匀设计的交叉操作尽可能地获得目标空间中均匀分布的非劣解,帮助种群跳出局部最优解,并通过一种新的聚类操作选择外部存档中有代表性的非劣解,从而控制外部存档规模,降低计算复杂度。对基准函数的测试结果表明,UCMOPSO算法相比同类算法在收敛性和分布性方面具有优势。  相似文献   

11.
针对传统的模糊C-均值聚类算法对初始聚类中心较敏感、易陷入局部最优的缺点,将粒子群优化算法和FCM算法相结合,提出一种改进的模糊聚类算法。该算法利用粒子群算法的全局搜索能力代替FCM算法寻找初始聚类中心,使其跳出局部最优,实现模糊聚类。主要从反映数据集分类的类内紧致性程度和类间分离性程度的角度考虑,重新设计适应度函数。实验结果表明,提出的算法在聚类正确率和有效性指标上有更好的效果。  相似文献   

12.
针对传统方法存在的缺点,提出一种基于粒子群K均值聚类算法的电梯交通模式识别方法.该方法通过对此前一周的原始客流数据进行聚类分析,得到相应交通模式的聚类中心坐标.针对实时变化的交通流数据,采集5min时段客流数据,根据最近邻原则划分其归属的聚类中心,从而识别出当前的交通模式.仿真实验表明,该方法能对电梯交通模式进行有效识别,实时性较好.  相似文献   

13.
针对传统K均值聚类算法对初始化敏感和容易陷入局部最优的缺点,提出了一种基于扰动免疫粒子群和K均值的混合聚类算法。该算法采用K均值将粒子群进行分类,选择平均适应度值最高的聚类域用于产生疫苗,在粒子更新过程中采用疫苗接种机制和免疫选择机制提高粒子的多样性。当个体极值和全局极值连续停滞代数超过所设置的阀值时,算法使用扰动算子改变粒子群的运动方向,提高算法跳出局部极值的能力。当扰动次数达到设置的最大值时,对各个粒子进行K均值操作,提高收敛精度。实验结果表明,该算法具有较高的正确率和较好的稳定性。  相似文献   

14.
在分析k均值聚类和免疫进化聚类不足的基础上,提出一种基于Parzen密度估计的多目标免疫克隆聚类方法.该算法针对多目标免疫克隆算法中克隆规模难以确定的问题,根据密度聚类的思想,引入核密度估计,根据密度和进化代数确定各抗体的克隆规模,使用混沌变异增加抗体多样性.最后通过TOPSIS(technique for orderpreference by similarity to an ideal solution)方法进行抗体选择.人工以及UCI(universal chess interface)数据集上的仿真实验表明,该方法可以有效地提高算法速度,得到较好的聚类结果.  相似文献   

15.
K均值算法简单快速,但其结果容易受初始聚类中心影响,并且容易陷入局部极值。该文结合粒子群优化算法和免疫系统中的免疫调节机制与免疫记忆功能对K均值算法进行改进,提出一种基于免疫粒子群优化的聚类算法。实验结果证明,该算法解决了K均值算法存在的对初值敏感的缺点,聚类结果稳定,而且比基于粒子群优化的聚类算法具有更好的聚类效果。  相似文献   

16.
基于敏感点颜色聚类和行聚类筛选的文本提取   总被引:1,自引:0,他引:1  
针对现有的文本提取算法不能适应复杂背景变化和文字本身的形状变化问题,提出一种基于敏感点颜色两级聚类和文本行聚类筛选的方法。新方法利用人眼视觉对颜色大幅度变化更敏感的特点,以敏感点的主要颜色作为聚类分析的依据,克服了现有阈值方法和聚类方法受背景颜色变化影响较大的问题。在此基础上,以文本行的空间排列特征为依据进进行文本行筛选,以克服一般方法容易受文字形状和尺寸变化影响的缺点。实验表明,新方法对于背景的复杂变化和文字的形状尺寸变化都具有很好的适应性。  相似文献   

17.
基于粒子群优化的模糊C-均值聚类改进算法   总被引:3,自引:3,他引:3  
针对模糊C-均值聚类算法(FCM)存在易陷入局部优化的问题,将粒子群优化算法(PSO)和模糊C-均值聚类算法FCM相结合,提出了一种新的模糊聚类算法PSO-FCM.该算法使用PSO算法来代替FCM的迭代过程以实现模糊聚类,具有了很强的全局搜索能力,从而不用再为得到好的聚类效果而反复选择初值.仿真实验结果表明,提出的模糊聚类算法提高了FCM的搜索能力,具有更好的稳定性和健壮性,优化能力增强,提高了聚类的效率和效果.  相似文献   

18.
基于聚类特性的大规模文本聚类算法研究   总被引:3,自引:0,他引:3  
一、引言随着Internet的飞速发展,人们能从网上得到更多的信息,但过多的信息常常会导致信息迷失。将信息进行分类是帮助信息利用的有效方法,聚类则是文本类别划分时常用的技术,其特点是不需训练集即可从给定的文本集合中找到聚类划分。已有的聚类方法大多是针对小规模数据的,当计算资源和时间受到限制时,原有的大部分方法已不能满足要求,需要能够处理大规模数据的算法。标准k均值方法是比较基本也是很常用的一种聚类方法,其计算复杂度与模式数量成线性关系,这使其具有处理大规模数据的可能。k均值方法本质上是一种选代的方法,当数据不能一次全部读入内存时,则需和磁盘进行多次数据交换,并且这种交换相应于迭代次数要反复多次,这无疑需要花费大量的I/O时间。  相似文献   

19.
粗糙集理论是一种处理边界对象不确定的有效方法。将粗糙集与K均值结合的粗糙K均值聚类算法,具有简单高效且可处理聚类边界元素的特点,但同时存在缺陷。针对粗糙K均值聚类算法对初始点敏感,经验权重设置忽略数据差异性,阈值设置不合理导致聚类结果波动性大的缺陷,本文提出结合蚁群算法的改进粗糙K均值聚类算法,改进的算法中使用蚁群算法中随机概率选择策略和信息素更新的正负反馈机制,以及采用动态调整算法阈值和相关权重的方法,对粗糙K均值聚类算法进行优化。最后采用UCI的Iris、Balance-scale和Wine数据集分别对算法进行实验。实验结果表明,改进后的粗糙K均值聚类算法得到的聚类结果准确率更高。  相似文献   

20.
K-means算法是数据挖掘中非常经典的算法。通过数据之间内在关联性将同类数据组合在一起,这对于大量混乱的数据进行资源整合具有非常重要的意义。就K-means聚类算法在文本处理领域的应用展开研究,分析在文本聚类过程中数据的处理流程,涉及文本中特征项的选取、文本的预处理操作、文本的结构化表示和文本之间相似度计算等步骤。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号