首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
《信息技术》2019,(1):66-70
针对传统K-means聚类中存在的一系列问题,文中提出了一种基于K-means聚类的改进算法。该算法首先利用K-means++聚类从数据中选择K个距离尽可能远的对象作为初始聚类中心,然后利用K-mediods聚类选择数据样本的中位数作为聚类中心的对象,最后与两步聚类结合。通过对几个常用UCI标准数据集进行仿真实验,结果表明该算法比传统算法更优。  相似文献   

2.
K-means聚类算法研究综述   总被引:5,自引:0,他引:5  
总结评述了K-means聚类算法的研究现状,指出K-means聚类算法是一个NP难优化问题,无法获得全局最优。介绍了K-means聚类算法的目标函数、算法流程,并列举了一个实例,指出了数据子集的数目K、初始聚类中心选取、相似性度量和距离矩阵为K-means聚类算法的3个基本参数。总结了K-means聚类算法存在的问题及其改进算法,指出了K-means聚类的进一步研究方向。  相似文献   

3.
从传统K-means算法对初始中心的敏感性分析出发,提出了一种优化初始聚类中心的算法.该算法结合一种改进的遗传算法和网络中心数学模型对初始中心进行优化,有效地解决了算法对初始聚类中心的敏感性问题,取得了较好的实验结果.  相似文献   

4.
K-means聚类算法在随机选择的初始聚类中心的基础上进行聚类,其聚类效果会因为初始聚类中心的不确定性而不稳定。为了优化其聚类效果,提出了基于近邻传播算法(AP算法)的K-means聚类优化算法(APK-means)。该算法首先通过近邻传播算法生成若干个初始聚类,然后依序选择k个聚类规模最大的聚类中心作为K-means聚类算法的初始聚类中心,接着运行K-means聚类。算法有效性分析和实验结果验证了该算法有效优化了K-mean算法的聚类稳定性和有效性。  相似文献   

5.
6.
聚类算法是数据挖掘中的重要技术,用于发现数据中未知的分类,是电子商务领域实现个性化推荐的重要方法。个性化推荐服务,是一种针对不同特征的用户推出适合于用户的信息及服务。文章介绍了一种K-means的聚类算法,该算法主要应用于数据挖掘领域,也在推荐系统的研究中占有重要的地位。文章还详细的分析了该算法目前存在的不足,针对该算法对初始值有一定要求这一不足,提出了一种通过预处理初始聚类中心的方法,以此来改进该算法,从实验结果可知,该改进算法能够减少迭代次数,提高计算效率。  相似文献   

7.
针对传统K-means算法对初始聚类中心选取的问题,提出了基于数据样本密度和距离来选取初始聚类中心的改进K-means算法,该算法保证了初始中心点集的第一点为确定的(最大密度点),在基于距离最远的其他中心点搜索过程中,得到的中心点也基本上是确定的,消除了初始中心点选择的随机性,同时保证了获得较高质量的初始中心点。理论分析和实验结果表明:改进的k-means算法是一种有效的入侵检测方法,根据此方法设计的入侵检测系统是有效可行的。  相似文献   

8.
《信息技术》2019,(11):20-23
文中对大数据聚类算法K-means算法及其优化进行研究,并主要针对确定聚类数目和初始中心给出了优化的算法。首先,利用平均误差平方和的指标来评估聚类结果的好坏,从而确定聚类的数目;其次,利用秩序化原始数据的方法进而实现有序选取初始中心;最终由结果分析看出,优化后算法相比于传统算法,聚类效果更好。  相似文献   

9.
周浩理  李太君  肖沙 《电视技术》2015,39(17):139-142
K-means算法是经典的基于划分的聚类算法,但该算法存在依赖于初始聚类中心、容易陷入局部最优解等缺点,针对这些缺点,本文提出了基于微正则退火K-means聚类算法,通过继承微正则退火算法的高效全局寻优特性,可以避免陷入局部最优解。实验结果表明,改进的算法能够有效的减少原算法对初始聚类中心点的依赖,提高算法的稳定性,摆脱原算法容易陷入局部最优解的缺点。  相似文献   

10.
基于划分的数据挖掘K-means聚类算法分析   总被引:1,自引:0,他引:1  
为提升数据挖掘中聚类分析的效果,在分析数据挖掘、聚类分析、传统K-means算法的基础上,提出一种改进的K-means算法。首先将整体数据集分为k类,然后设定一个密度参数为■,该密度参数反映数据库中数据所处区域的密度大小,■值与密度大小成正比,通过密度参数优化k个样本数据的聚类中心点选取;依据欧几里得距离公式对未选取的其他数据到各个聚类中心之间的距离进行计算,同时以此距离为判别标准,对各个数据进行种类划分,从而得到初始的聚类分布;初始聚类分布得到之后,对每一个分布簇进行再一次的中心点计算,并判断与之前所取中心点是否相同,直到其聚类收敛达到最优效果。最后通过葡萄酒数据集对改进算法进行验证分析,改进算法比传统K-means算法的聚类效果更优,能够更好地在数据挖掘当中进行聚类。  相似文献   

11.
针对机器学习中聚类算法参数多样调参复杂的问题,分析了基于PSO算法在机器学习参数组合寻优方面的可行性,设计了一种基于PSO算法的K-means机器学习聚类算法的参数寻优策略。通过PSO算法找到模型最佳的参数组合,提高K-means机器学习模型的性能。通过对算法调优策略进行测试结果表明,使用PSO算法对K-means机器学习聚类算法进行参数调优,不仅能够找到适于该数据的最佳参数组合提高聚类算法的性能,也可以减少经验调参所带来的误差和成本。  相似文献   

12.
《现代电子技术》2018,(10):164-168
为了解决K-means聚类算法图像分割质量过度依赖于初始聚类中心选取,且易于陷入局部最优解等问题,提出一种基于动态粒子群优化(DPSO)与K-means聚类的图像分割算法(DPSOK)。通过动态调整惯性系数与学习因子来增强PSO算法的性能;然后计算粒子群适应度方差,找准切换至K-means算法时机;随后,将DPSO输出结果用来初始化K-means聚类中心,使其收敛至全局最优解;最后,通过最小化目标函数的多次迭代,使K-means的聚类中心不断更新,直到收敛。实验结果表明,DPSOK能有效提高K-means的全局搜索能力,在图像分割中它比K-means,PSO获得了更好的分割效果,且与粒子群优化和K-means算法相比,DPSOK算法具有更高的分割质量与效率。  相似文献   

13.
提出一种适用于大型数据集的分布式聚类算法。该算法以传统的K-means算法为基础进行合理的改进,使之更适用于分布式环境,并从算法的复杂度分析,将该算法与传统的集中式K-means算法及其他分布式算法进行比较。实验表明,该算法在保持了集中式K-means算法所有必要特性的同时,提高了数据处理速度。  相似文献   

14.
提出一种基于均值聚类的车牌定位算法,该算法能避免由于环境的复杂而带来的定位的不确定性。  相似文献   

15.
在线学习是近年来随着互联网的发展而逐渐兴起的一种学习方式,它的便捷性和丰富的学习资源吸引了越来越多的学习者。随着在线学习平台日益普及,海量的用户数据也随之产生。如何从这些数据中提取有价值的信息,促进教育教学质量提升是当前值得思考的重要课题。文章介绍了基于K均值聚类算法(K-means Clustering Algorithm, K-means)的在线学习行为聚类分析方法,为在线学习平台提供了重要的数据分析和应用支持,帮助教师及平台管理者及时调整教学模式和教学策略,以提升学习者的在线学习效果。  相似文献   

16.
《现代电子技术》2019,(8):145-150
针对传统K-means聚类算法对高维非线性数据聚类效果不佳、聚类时间消耗大的问题,文中对高维数据的预处理进行研究,提出一种基于深度信念网络(DBN)的K-means聚类算法(DBNOK)。此算法首先使用多层受限玻尔兹曼机(RBM)对数据进行特征学习,并将学习到的隐含特征进行K-means相关参数和初始聚类中心进行交叉迭代优化。用DBNOK算法分别在低维数据集和高维数据集上进行实验,结果表明,DB-NOK算法聚类准确率优于标准的K-means算法和模糊均值聚类(FCM)算法。  相似文献   

17.
本文对传统的K-means聚类算法进行了深入的分析研究,发现了算法当中的一些缺陷和漏洞,并且找出可以改进K-means聚类算法的方法,使聚类分析的结果更具有实际意义,保证了聚类结果的高质量。  相似文献   

18.
《信息技术》2019,(12):76-80
文中讨论在文本类目数未知的情况下,如何对数据量过少的短文本进行有效聚类的问题。短文本的特点是每一份样本文章数据少,数据稀疏,用常规的聚类方法进行文本聚类不能取得很好的效果。文中提出了一种基于K-means的改进算法,提出一种简单降维方式和新的判别样本点距离的方法,经实验验证,文中改进算法比原K-means算法有更高的准确性。  相似文献   

19.
阐述学生在线学习行为的问题分析,引入K-means聚类算法,为学生在线学习行为研究提供更加准确高效的选择。分析表明,统计数据可以帮助教师掌握学生的在线学习状况,发现在线学习中存在的问题,从而实施针对性的干预和指导。  相似文献   

20.
随着等级测评工作的定期进行,等级测评过程中会不断产生并积累海量的测评数据,但是从以测评报告形式存在的测评数据中无法有效地提取出有价值的信息,无法为后续的等级保护工作形成参考指导。利用K-means聚类算法对等级测评数据进行了分析。首先,介绍了等级测评的概念及基本内容;然后,阐述了K-means聚类算法理论;最后,详细地介绍了基于K-means聚类算法的等级测评数据分析的具体流程,为等级测评数据的充分利用提供了一定的参考。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号