基于数据密集性的自适应K均值初始化方法 AN ADAPTIVE K-MEANS INITIALIZATION METHOD BASED ON DATA DENSITY期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

基于数据密集性的自适应K均值初始化方法

作者单位：	;1.四川行政学院计算机系

摘要：	K均值聚类算法在数据挖掘、机器学习领域被广泛应用。但其初始聚类中心的选取对整个聚类效果会产生很大的影响,因此,如何合理地初始化K均值聚类算法成为重要的研究方向。提出一种基于数据内在密集性的自适应初始聚类中心选取方法。该方法分为两个过程,第一个过程给出数据密集性的定义,并基于数据密集性选出满足条件的候选初始聚类中心,第二个过程是对选出的候选初始中心进行后处理,使其个数与数据类一致。实验证明,提出的方法有如下优势:1)能够自主发现数据集中数据分布的密集性,并能够合理找出初始聚类中心;2)对离群点和噪声鲁棒;3)减少了K均值聚类算法的迭代步骤;4)易于实现。
关键词：	聚类 K均值初始化初始聚类中心选取
AN ADAPTIVE K-MEANS INITIALIZATION METHOD BASED ON DATA DENSITY

Abstract:

Keywords:
本文献已被 CNKI 等数据库收录！