结合孤立森林和鲸鱼优化算法的三支k-means |
| |
作者姓名: | 李浩溥 李志聪 |
| |
作者单位: | 哈尔滨师范大学计算机科学与信息工程学院,黑龙江哈尔滨150025 |
| |
摘 要: | 针对k-means算法的聚类结果对初始聚类中心的选取较为敏感、选择聚类数目存在一定的主观性以及离群数据影响的问题,提出了一种结合孤立森林和鲸鱼优化算法的三支k-means算法(iF-W-TWKM)。首先利用孤立森林算法对数据集进行清洗,将数据集划分为两个子集:正常数据子集和异常数据子集。使用正常数据子集进行后续算法步骤,待算法结束后使用得到的聚类中心将异常数据子集中的样本划分到各类簇的边界域。利用鲸鱼优化算法建立以STDI为目标函数的优化问题进行全局寻优实现聚类中心的选取,避免局部最优。实验结果表明,改进后的算法在ACC、AS、DBI指标上整体优于k-means和TK-means,具有更好的聚类表现。
|
关 键 词: | 三支聚类 孤立森林算法 鲸鱼优化算法 聚类中心 |
本文献已被 万方数据 等数据库收录! |
|