首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 78 毫秒
1.
一种改进的特征加权K-means聚类算法   总被引:4,自引:0,他引:4  
提出了一种改进的特征加权K-means聚类算法.该算法首先基于数据样本分布选取初始聚类中心,然后设计特征加权的K-means聚类算法.实验结果证明,该算法能产生质量较高的聚类结果,并且能处理数值、符号两类数据.  相似文献   

2.
《信息技术》2019,(11):20-23
文中对大数据聚类算法K-means算法及其优化进行研究,并主要针对确定聚类数目和初始中心给出了优化的算法。首先,利用平均误差平方和的指标来评估聚类结果的好坏,从而确定聚类的数目;其次,利用秩序化原始数据的方法进而实现有序选取初始中心;最终由结果分析看出,优化后算法相比于传统算法,聚类效果更好。  相似文献   

3.
K-means聚类算法在随机选择的初始聚类中心的基础上进行聚类,其聚类效果会因为初始聚类中心的不确定性而不稳定。为了优化其聚类效果,提出了基于近邻传播算法(AP算法)的K-means聚类优化算法(APK-means)。该算法首先通过近邻传播算法生成若干个初始聚类,然后依序选择k个聚类规模最大的聚类中心作为K-means聚类算法的初始聚类中心,接着运行K-means聚类。算法有效性分析和实验结果验证了该算法有效优化了K-mean算法的聚类稳定性和有效性。  相似文献   

4.
基于划分的数据挖掘K-means聚类算法分析   总被引:1,自引:0,他引:1  
为提升数据挖掘中聚类分析的效果,在分析数据挖掘、聚类分析、传统K-means算法的基础上,提出一种改进的K-means算法。首先将整体数据集分为k类,然后设定一个密度参数为■,该密度参数反映数据库中数据所处区域的密度大小,■值与密度大小成正比,通过密度参数优化k个样本数据的聚类中心点选取;依据欧几里得距离公式对未选取的其他数据到各个聚类中心之间的距离进行计算,同时以此距离为判别标准,对各个数据进行种类划分,从而得到初始的聚类分布;初始聚类分布得到之后,对每一个分布簇进行再一次的中心点计算,并判断与之前所取中心点是否相同,直到其聚类收敛达到最优效果。最后通过葡萄酒数据集对改进算法进行验证分析,改进算法比传统K-means算法的聚类效果更优,能够更好地在数据挖掘当中进行聚类。  相似文献   

5.
SOM+K-means两阶段聚类算法及其应用   总被引:2,自引:0,他引:2  
在众多聚类算法中,K-means和自组织神经网络(SOM)是较为经典的2个。在分析2种算法优缺点的基础上,提出基于SOM的K-means两阶段聚类算法,该算法根据SOM算法自动聚类的优点得到初步聚类数目和各类中心点,以此作为K-means算法的初始输入进一步聚类,从而得到精确的聚类信息。最后,应用该算法对某地区电信家庭客户数据进行分析,结果表明该算法有较好的聚类效果。  相似文献   

6.
《信息技术》2019,(1):66-70
针对传统K-means聚类中存在的一系列问题,文中提出了一种基于K-means聚类的改进算法。该算法首先利用K-means++聚类从数据中选择K个距离尽可能远的对象作为初始聚类中心,然后利用K-mediods聚类选择数据样本的中位数作为聚类中心的对象,最后与两步聚类结合。通过对几个常用UCI标准数据集进行仿真实验,结果表明该算法比传统算法更优。  相似文献   

7.
常彤 《通讯世界》2017,(19):289-290
K-means算法因其简单、易理解、速度快等优点在众多领域得到广泛的应用,然而该算法的K值选取,初始聚类点的选取和对于孤立点的处理等都会影响最终聚类结果.根据k-means算法目前的应用研究现状,针对这些缺点对算法进行改进,最后指出了改进中存在的一些问题,并指出未来的研究方向.  相似文献   

8.
目前常见的车牌识别算法有神经网络算法,模板匹配算法等,无论何种车牌识别算法,在车牌发生污损情况时,其正确识别率均有较大程度的下降。为解决这一问题,提出了一种基于K-means聚类算法的车牌去污算法。采用人为控制车牌污损程度的方法定量研究本算法的去污有效性,最终发现采用该算法恢复的污损车牌图像相比于恢复前上升近一倍。在污损程度较小时,采取该算法去污后CNN网络识别正确率可以提升约50%;在污损程度较大时,采取该算法去污后CNN神经网络识别正确率可以上升一倍。  相似文献   

9.
10.
周浩理  李太君  肖沙 《电视技术》2015,39(17):139-142
K-means算法是经典的基于划分的聚类算法,但该算法存在依赖于初始聚类中心、容易陷入局部最优解等缺点,针对这些缺点,本文提出了基于微正则退火K-means聚类算法,通过继承微正则退火算法的高效全局寻优特性,可以避免陷入局部最优解。实验结果表明,改进的算法能够有效的减少原算法对初始聚类中心点的依赖,提高算法的稳定性,摆脱原算法容易陷入局部最优解的缺点。  相似文献   

11.
针对传统的K-means算法对初始聚类中心的敏感很大,极易陷入局部最优值,基于遗传算法的K-means聚类算法由于个体的多样性不足而常出现早熟等现象,采用遗传模拟退火算法优化初始聚类中心点后进行K-means聚类,并提出了一种新的用于评价聚类结果的适应度函数,该函数更为准确地反映类内距离和类间距离.实验结果表明,该方法能获得更好的聚类结果.  相似文献   

12.
针对当前政府和社会对空巢老人的识别缺乏有效技术手段的问题,提出了一种基于加权随机森林算法的空巢电力用户识别方法。首先通过调查问卷获取部分准确空巢用户标签,并从用电水平、用电波动、用电趋势 3 个方面构建用户用电特征库,由于空巢与非空巢存在用户数据不平衡问题,采用加权随机森林算法改善机器学习对数据敏感的现象,将该算法模型在电力公司采集系统部署上线,并对2 000户未知类型用户进行空巢识别,其空巢识别准确率达到 74.2%。结果表明,从用电角度研究对空巢老人的识别,可以帮助电网公司了解空巢老人的个性化、差异化需求,从而为用户提供更精细的服务,也可以协助政府和社会开展帮扶工作。  相似文献   

13.
陆战场上的多个机动兵力集群在某些情况下可能出现队形相互交错的情况,运用传统的基于实体空间信息的聚类算法(如K-means算法)进行实体目标分群时效果不理想。通过对实体空间信息进行分析与处理,提出了一种基于改进的K-means算法的陆战场机动目标分群方法,重新设计了用于K-means算法的距离度量函数,引入模块度的概念,实现了k值的自适应选取,通过实验验证了该方法对呈较复杂分布的陆战场机动目标进行分群的合理性。  相似文献   

14.
聚类算法是用来提取有用信息的重要技术,k均值聚类算法是其中应用最为普遍的聚类分析算法.然而,这种聚类算法的主要问题是,最终的聚类结果高度依赖于初始聚类中心.标准的k均值聚类算法使用随机初始中心会得到很差的聚类结果.因此,为了克服标准k-均值聚类算法的不足,本文提出一种基于贡献率的方法来优化初始中心的选择,以便得到一个好的聚类结果.将新提出的初始化方法应用到一些知名的数据集,将其与几种传统的初始化算法相比较,证明新提出的初始化方法具有良好的性能.本文所提出的方法不仅容易理解,而且聚类的迭代次数和执行时间也明显下降.本文的初始化方法可以保证得到一个比较好的聚类结果.  相似文献   

15.
K-means聚类算法研究综述   总被引:5,自引:0,他引:5  
总结评述了K-means聚类算法的研究现状,指出K-means聚类算法是一个NP难优化问题,无法获得全局最优。介绍了K-means聚类算法的目标函数、算法流程,并列举了一个实例,指出了数据子集的数目K、初始聚类中心选取、相似性度量和距离矩阵为K-means聚类算法的3个基本参数。总结了K-means聚类算法存在的问题及其改进算法,指出了K-means聚类的进一步研究方向。  相似文献   

16.
《现代电子技术》2018,(10):164-168
为了解决K-means聚类算法图像分割质量过度依赖于初始聚类中心选取,且易于陷入局部最优解等问题,提出一种基于动态粒子群优化(DPSO)与K-means聚类的图像分割算法(DPSOK)。通过动态调整惯性系数与学习因子来增强PSO算法的性能;然后计算粒子群适应度方差,找准切换至K-means算法时机;随后,将DPSO输出结果用来初始化K-means聚类中心,使其收敛至全局最优解;最后,通过最小化目标函数的多次迭代,使K-means的聚类中心不断更新,直到收敛。实验结果表明,DPSOK能有效提高K-means的全局搜索能力,在图像分割中它比K-means,PSO获得了更好的分割效果,且与粒子群优化和K-means算法相比,DPSOK算法具有更高的分割质量与效率。  相似文献   

17.
《现代电子技术》2016,(23):116-120
校园网中的服务器存有海量的用户访问日志文件,记录了校园网用户的访问信息。鉴于此,提出了一种基于聚类算法的校园网用户行为分析技术,设计和实现了数据预处理系统,对日志数据进行一系列的清理、合并,标准化等预处理,使其更好地适应后续的聚类操作。将预处理后的数据作为输入数据,分别实现了三种常用的聚类算法对日志数据进行聚类,然后从聚类准确率和聚类速度两个角度对现有算法进行优化。为了提高聚类准确率,提出了用K-均值算法结合AGNES算法的方法;为了提高聚类速度,在MPICH2平台上设计和实现了并行K-均值算法,实现多机并行分析,最后简单介绍了校园网行为分析系统的应用。  相似文献   

18.
《现代电子技术》2015,(22):80-83
为实现视频监控设备对雾天天气现象的自动识别,提出了基于K均值聚类算法的雾天天气现象自动识别方法。该方法通过分析雾天天气现象对视频图像采集的影响,提取图像饱和度的均值、方差为特征参数,并利用K均值聚类算法对训练图像进行分类,得到不同图像类别的聚类中心,测试阶段计算不同图像与聚类中心的相异度即可完成分类。实验结果表明,该方法简洁高效,易于实现对大规模图像数据的处理,并能实现图像分类后类别的标注,对雾天的识别率高于90%。  相似文献   

19.
一种改进的K平均聚类算法   总被引:2,自引:0,他引:2  
典型K平均算法中的聚类数k必须是事先给定的确定值,然而实际中很难精确确定,因而无法解决该核算法的实际问题.为此,提出距离代价函数作为最佳聚类数的有效性检验函数,建立了相应的数学模型,并据此提出了一种改进的k值优化算法.实验证明,与传统基于平均值方法实现数据聚类相比,用改进K值优化算法有效提高数据聚类效果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号