基于数据场的数据势能竞争与K-means融合的聚类算法 |
| |
作者单位: | ;1.江南大学物联网工程学院 |
| |
摘 要: | K-means算法采用欧氏距离进行数据点的划分,不能够准确地刻画数据集特征,而随机选取聚类中心点的机制,也不能获得好的聚类结果。为此,提出一种基于数据场的数据势能竞争与K-means算法融合的聚类算法。算法中定义了数据场的概念,利用局部最小距离进行数据聚合势能的竞争,然后利用势能熵提取基于数据集分布的最优截断距离,根据截断距离与斜率确定出簇中心点,实现K-means聚类。在UCI数据集上的测试结果表明,融合后的算法具有更好的聚类结果。
|
关 键 词: | 数据竞争 数据场 势能熵 斜率 复杂数据集 |
CLUSTERING ALGORITHM FOR COMPETITION OF DATA POTENTIAL ENERGY AND K-MEANS BASED ON DATA FIELD |
| |
Abstract: | |
| |
Keywords: | |
|
|