首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
基于MMD聚类算法及在高校成绩分析中的应用   总被引:2,自引:1,他引:1  
介绍了在聚类算法中广泛使用的k均值算法。针对其受选择初始质心和聚类个数影响的缺点,给出了改进的k均值算法。使用最大最小距离法选择初始聚类中心,并确定聚类个数。进行了改进前后的对比实验。实验结果表明,改进后的算法比较稳定、准确。将改进后的算法应用到高校成绩分析中,达到较好的分类效果。  相似文献   

2.
针对聚类中广泛应用的经典k均值算法随机选择初始质心和易受孤立点影响的不足,给出了二次改进的k均值算法。首先使用距离法移除孤立点,然后采用邻近吸收法对初始聚类中心的选择进行改进,并做了改进前后的对比实验。结果表明,改进后的算法比较稳定、准确,受孤立点和随机选择质心的影响也有所降低。  相似文献   

3.
为提升聚类算法的聚类效果, 采用仿生优化算法与k 均值聚类算法相结合(BFOA-K)实现数据聚类。在聚类过程中, 为解决k 均值对于初始质心敏感以及容易陷入局部最优的问题, 使用果蝇优化算法确定k 均值聚类算法的质心, 再使用k 均值聚类算法进行数据聚类。针对果蝇优化算法对于飞行步长的影响, 采用F分布动态改变步长, 提升算法全局搜索能力。同时采用精英保留策略, 提升果蝇种群的多样性, 扩大了搜索范围和提升了搜索效率。利用4 个UCI 标准数据集对算法进行仿真实验, 结果表明, 本文提出的BFOA-K 算法在各项聚类评估指标中都优于其余对比算法, 提升了算法的收敛性, 证明了算法的有效性和可行性。  相似文献   

4.
针对模糊C均值(FCM)聚类算法聚类个数难以确定、搜索过程易陷入局部最优的缺陷,把蚁群算法与改进的FCM聚类算法相结合,提出了一种基于蚁群算法的带有空间邻域信息的模糊C均值聚类图像分割算法.首先利用分水岭算法对图像进行初始分割,然后利用蚁群算法寻优,求得聚类中心和聚类个数,将其作为模糊C均值聚类的初始聚类中心和聚类个数进行模糊聚类.实验结果表明:由于聚类样本数量显著减少,很大程度上提高了聚类速度和抗噪能力,增强了算法的鲁棒性.  相似文献   

5.
结合K均值和非负矩阵分解集成文本聚类算法   总被引:1,自引:1,他引:0  
将非负矩阵分解(NMF)引入到文本聚类集成问题中,为解决NMF随机初始化所引起的不稳定性问题,首先采用最小最大原则确定K均值算法的初始质心,并获得稳定的聚类结果;其次,将K均值算法的聚类结果作为NMF的初始因子矩阵,并对超图的邻接矩阵进行NMF,获得基矩阵和系数矩阵;最后根据系数矩阵获得最终的聚类结果,由此设计了NMFK算法。在多组真实文本集上进行了实验,结果表明:NMFK算法运行高效,并且获得了比其他常见的聚类集成算法更加优越的结果。  相似文献   

6.
针对多尺度可能性聚类算法(MPCM)计算复杂度较高的问题,提出一种改进的多尺度可能性聚类算法(IMPCM).算法利用k-均值聚类的收敛点来作为MPCM的初始点,在继承了MPCM优点的同时,解决了原始MPCM中无效初始点过多以及初始点位置不理想造成的迭代次数过高的问题.对比实验结果表明,算法具有良好的聚类效果与更高的计算效率.  相似文献   

7.
为了提高网络行为聚类的准确性和有效性,提出了一种用于分析网络行为的改进K均值算法.算法首先计算K类中心的轮廓系数,以及各类数据与类中心的距离,然后自动选取优秀样本,最后求均值作为优化后的初始聚类中心重新进行聚类.在UCI数据集上的实验表明,该算法聚类时间短,提高了聚类的准确性.  相似文献   

8.
在医学图像分割研究中,针对模糊C均值(FCM)聚类算法聚类个数难于确定、搜索过程容易陷入局部最优的缺陷,把蚁群算法与FCM聚类算法有机结合,提出了一种基于蚁群算法的模糊C均值聚类图像分割算法.该算法首先利用蚁群算法全局性和鲁棒性的优点,得到聚类中心和聚类个数,再将其作为模糊C均值聚类的初始聚类中心和聚类个数,弥补了传统FCM聚类算法的不足,得到了较好的分割效果.实例分析证明了算法的有效性和实用性.  相似文献   

9.
基于蚁群算法的模糊C均值聚类医学图像分割   总被引:1,自引:0,他引:1  
在医学图像分割研究中,针对模糊C均值(FCM)聚类算法聚类个数难于确定、搜索过程容易陷入局部最优的缺陷,把蚁群算法与FCM聚类算法有机结合,提出了一种基于蚁群算法的模糊C均值聚类图像分割算法. 该算法首先利用蚁群算法全局性和鲁棒性的优点,得到聚类中心和聚类个数,再将其作为模糊C均值聚类的初始聚类中心和聚类个数,弥补了传统FCM聚类算法的不足,得到了较好的分割效果. 实例分析证明了算法的有效性和实用性.  相似文献   

10.
针对模糊C均值算法对初始中心敏感、容易陷入局部最优解,且算法迭代速度慢等问题,依据模糊聚类的全局中心理论,建立了一种快速全局中心模糊聚类系统模型,并给出了相关理论分析和算法流程。该模型通过DKC值方案对各数据成员进行密集度分析来确定初始质心,并结合AM度量提出自定义寻优函数,依据该函数在算法运行的每一个阶段来逐一动态增加聚类中心,直至算法收敛。通过实验对比和验证,该过程降低了随机选取聚类中心对聚类结果的影响,跳出局部最优解,减少计算量,具有更高的聚类精度和更快的收敛速度。  相似文献   

11.
针对模糊C-均值算法(FCM)具有局部最优问题和初值敏感性的缺陷,将微粒群优化算法应用于文本模糊聚类, 提出了基于微粒群优化算法的模糊C-均值算法PFCM.该算法首先采用实数编码方式对聚类原型进行编码,利用微粒群优化算法的全局搜索性能对初始聚类原型的选取进行指导,然后利用模糊C-均值算法进行聚类.使用算法PFCM对文本集合进行聚类实验,并用目标函数值和划分系数来判断模糊划分的效果,实验结果表明,与FCM相比,该算法具有较好的全局收敛性和较好的聚类结果.  相似文献   

12.
一种改进的模糊C均值聚类算法   总被引:1,自引:0,他引:1  
针对模糊C均值(FCM)聚类算法中,聚类效果往往受到聚类数目和初始聚类中心的影响这一问题,提出了基于平均信息熵确定聚类数目的方法,并采用密度函数法来获得初始聚类中心.实验结果表明,改进后的算法较好地解决了初值问题,与随机初始化方法相比,迭代次数少,收敛速度快.  相似文献   

13.
针对全局K-均值算法时间复杂度大的问题,提出一种增量选择初始聚类中心的新方法。选择数据集中周围分布最密集的样本作为第一个初始聚类中心,选择最小化目标函数贡献大,并且和已有聚类中心距离远的样本作为下一个初始聚类中心。改进算法减少了增量选取初始聚类中心时的计算量,降低了时间复杂度。实验证明,改进算法与全局K-均值算法、快速全局K-均值算法相比,在不影响聚类效果的基础上,减少了聚类时间,与优化初始聚类中心的算法相比,聚类效果更优。  相似文献   

14.
一种改进的k-means中文文本聚类算法   总被引:3,自引:0,他引:3  
提出了k-means聚类算法中选取初始聚类中心及处理孤立点的新方法,改进了k-means算法对初始聚类中心和孤立点文本很敏感的不足之处,并将改进后的算法应用于中文文本聚类中。实验结果表明,改进的算法较原算法在准确率上有较大提高,并且具有更好的稳定性。  相似文献   

15.
提出了k-means聚类算法中选取初始聚类中心及处理孤立点的新方法,改进了 k-means算法对初始聚类中心和孤立点文本很敏感的不足之处,并将改进后的算法应用于中文文本聚类中.实验结果表明,改进的算法较原算法在准确率上有较大提高,并且具有更好的稳定性.  相似文献   

16.
针对K均值算法对初始聚类中心需要人为设定、对聚类中心敏感并且极易陷入局部最优的缺陷,用改进的DE算法对K均值算法进行优化.在DE算法中,采用动态交叉参数CR与缩放参数F,有效地平衡了DE算法的全局寻优能力与收敛速度二者的矛盾;利用混沌的随机性完成DE算法的种群初始化,利用其遍历性在DE进化后期的最优解附近进行混沌搜索,有效地提高了DE算法的全局寻优能力.最后,使用KDD99数据集对CDE-K均值算法进行验证,实验结果表明,CDE-K均值算法具有较好的聚类能力,在检验效果方面表现优秀.  相似文献   

17.
该文提出了一种改进的聚类算法来实现基于颜色的图像检索,并给出了基于分块主色的检索方法描述图像颜色特征。算法有效地解决了K-均值聚类算法初始聚类中心的选取问题。实验结果表明该算法与其他算法相比具有较好的准确性和检索效率,检索的效果和速度都有了提高。  相似文献   

18.
数据挖掘中经常使用k-means算法,它是经常使用的一种聚类分析算法,但易受初始聚类中心和聚类个数k的影响。因此对近年从算法原理、关键技术和优缺点等方面提出的较有代表性的关于初始聚类中心和k值确定的改进的k-means算法进行了分析。并选用知名数据集对一些典型算法进行测试和应用。上述工作将为数据挖掘的研究提供有益的参考。  相似文献   

19.
K-均值算法因其简单和高效性, 在文本聚类中占有重要地位. 针对传统的K-均值算法对初始点敏感、易陷入局部最优的问题, 结合遗传算法已经成为一种趋势. 在充分发挥K-均值算法的高效性的同时, 该文利用遗传算法的全局自适应优化特点克服了对初始点敏感的问题. 同时, 以余弦度量评价对象间的相似性并以此构造新的遗传算法适应度函数、收敛准则以及遗传算法种群更新方式, 提高了K-均值和遗传算法这种结合方式的聚类精度, 并增强了该结合算法的稳定性.  相似文献   

20.
针对化工过程灰箱建模存在的精确度差、速度慢、计算复杂度高等问题,对现行模糊C-均值聚类算法进行了改进,提出了一种快速全局优化的(用于建模的数据训练集)模糊聚类算法.该算法具有不依赖初始条件、收敛速度快等特点.实验结果表明,利用快速全局优化模糊聚类算法得到的数据,在灰色预测的时间和数据准确性方面都有了显著提高,计算机仿真实验表明了该算法的有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号