面向高维特征缺失数据的K最近邻插补子空间聚类算法 |
| |
引用本文: | 乔永坚,刘晓琳,白亮.面向高维特征缺失数据的K最近邻插补子空间聚类算法[J].计算机应用,2022,42(11):3322-3329. |
| |
作者姓名: | 乔永坚 刘晓琳 白亮 |
| |
作者单位: | 山西大学 计算机与信息技术学院,太原 030006 计算智能与中文信息处理教育部重点实验室(山西大学),太原 030006 |
| |
基金项目: | 国家自然科学基金资助项目(62022052);山西省基础研究计划项目(201901D211192);山西省“1331工程”提质增效建设计划项目 |
| |
摘 要: | 针对高维特征缺失数据在聚类过程中面临的因数据高维引发的维度灾难问题和数据特征缺失导致的样本间有效距离计算失效问题,提出一种面向高维特征缺失数据的K最近邻(KNN)插补子空间聚类算法KISC。首先,利用高维特征缺失数据的子空间下的近邻关系对原始空间下的特征缺失数据进行KNN插补;然后,利用多次迭代矩阵分解和KNN插补获得数据最终可靠的子空间结构,并在该子空间结构进行聚类分析。在6个图像数据集原始空间的聚类结果表明,相较于经过插补后直接进行聚类的对比算法,KISC算法聚类效果更好,说明子空间结构能够更加容易且有效地识别数据的潜在聚类结构;在6个高维数据集子空间下的聚类结果显示,KISC算法在各个数据集的聚类性能均优于对比算法,且在大多数据集上取得了最优的聚类精确度(ACC)和标准互信息(NMI)。KISC算法能够更加有效地处理高维特征缺失数据,提高算法的聚类性能。
|
关 键 词: | 高维数据 特征缺失 插补算法 子空间结构 聚类 |
收稿时间: | 2021-11-19 |
修稿时间: | 2021-11-29 |
|
| 点击此处可从《计算机应用》浏览原始摘要信息 |
|
点击此处可从《计算机应用》下载全文 |
|