首页 | 本学科首页   官方微博 | 高级检索  
     

改进的K-means聚类k值选择算法
引用本文:王建仁,马鑫,段刚龙. 改进的K-means聚类k值选择算法[J]. 计算机工程与应用, 2019, 55(8): 27-33. DOI: 10.3778/j.issn.1002-8331.1810-0075
作者姓名:王建仁  马鑫  段刚龙
作者单位:西安理工大学 经济与管理学院,西安,710054;西安理工大学 经济与管理学院,西安,710054;西安理工大学 经济与管理学院,西安,710054
基金项目:陕西省重点学科资助项目
摘    要:空间聚类算法中,聚类的效果在很大程度上受制于最佳k值的选择。典型的K-均值算法中,聚类数k需要事先确定,但在实际情况中k的取值很难确定。针对手肘法在确定k值的过程中存在的"肘点"位置不明确问题,基于指数函数性质、权重调节、偏执项和手肘法基本思想,提出了一种改进的k值选择算法ET-SSE算法。通过多个UCI数据集和K-means聚类算法对该算法进行实验,结果表明,使用该k值选择算法相比于手肘法能更加快速且准确地确定k值。

关 键 词:K-均值算法  k值选择  ET-SSE  算法

Improved K-means Clustering k-Value Selection Algorithm
WANG Jianren,MA Xin,DUAN Ganglong. Improved K-means Clustering k-Value Selection Algorithm[J]. Computer Engineering and Applications, 2019, 55(8): 27-33. DOI: 10.3778/j.issn.1002-8331.1810-0075
Authors:WANG Jianren  MA Xin  DUAN Ganglong
Affiliation:School of Economics and Management, Xi’an University of Technology, Xi’an 710054, China
Abstract:In spatial clustering algorithms, the effect of clustering depends to a large extent on the choice of the best [k] value. In the typical [K]-means algorithm, the [k] value of clusters needs to be determined in advance, but in actual cases, the value of [k] is difficult to determine. The paper proposes an improved [k]-value selection algorithm, ET-SSE, based on the nature of exponential function, weight adjustment, bias and Elbow Method for the “elbow-point” ambiguity in the process of determining the [k]-value. The algorithm is tested by multiple UCI data sets and [K]-means clustering algorithm. The results show that the [k]-value selection algorithm can determine the value of key more accurately than the Elbow Method.
Keywords:K-means algorithm  k-value selection  ET-SSE algorithm  
本文献已被 维普 万方数据 等数据库收录!
点击此处可从《计算机工程与应用》浏览原始摘要信息
点击此处可从《计算机工程与应用》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号