基于K近邻的模糊密度峰值聚类算法研究 Fuzzy Density Peaks Clustering Algorithm Based on K-nearest Neighbors期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

基于K近邻的模糊密度峰值聚类算法研究

作者单位：	;1.江苏联合职业技术学院常州刘国钧分院

摘要：	基于密度的聚类算法(Density Peak Clustering,DPC)广泛使用在处理非球形数据集的聚类问题,算法使用较少的参数就能够实现数据集的处理。但该算法存在这样一些的不足:首先,全局变量的设定没有考虑数据的局部结构,特别是当不同类别的局部密度差别很大的情况下,容易忽略一些密度较小的类别,聚类效果不理想。其次,DPC提出了一种通过决策图来人工选取聚类中心点的方法,这也是DPC算法在人工智能数据分析的一个重大缺陷。为此,本文提出了基于K近邻的模糊密度峰值聚类算法,算法针对这两方面的不足进行了改进。最后本文使用人工数据集和UCI数据集进行了实验,实验结果表明本文所提出的算法,在不通过人工选取聚类中心的情况下,能够正确地找出类别个数,并且保持着较高的聚类精确度,验证了算法的有效性。
关键词：	数据挖掘聚类算法密度峰值 K近邻
Fuzzy Density Peaks Clustering Algorithm Based on K-nearest Neighbors

Abstract:

Keywords: