神经正切核K‑Means聚类 |
| |
作者姓名: | 王梅 宋晓晖 刘勇 许传海 |
| |
作者单位: | 东北石油大学 计算机与信息技术学院, 黑龙江 大庆 163318 黑龙江省石油大数据与智能分析重点实验室(东北石油大学), 黑龙江 大庆 163318 中国人民大学 高瓴人工智能学院, 北京 100872 大数据管理与分析方法研究北京市重点实验室(中国人民大学), 北京 100872 |
| |
基金项目: | 国家自然科学基金资助项目(51774090);黑龙江省博士后科研启动金资助项目(LBH?Q20080);黑龙江省自然科学基金资助项目(LH2020F003);黑龙江省高等教育教学改革重点委托项目(SJGZ20190011) |
| |
摘 要: | 针对K-Means聚类算法利用均值更新聚类中心,导致聚类结果受样本分布影响的问题,提出了神经正切核K-Means聚类算法(NTKKM)。首先通过神经正切核(NTK)将输入空间的数据映射到高维特征空间,然后在高维特征空间中进行K-Means聚类,并采用兼顾簇间与簇内距离的方法更新聚类中心,最后得到聚类结果。在car和breast-tissue数据集上,对NTKKM聚类算法的准确率、调整兰德系数(ARI)及FM指数这3个评价指标进行统计。实验结果表明,NTKKM聚类算法的聚类效果以及稳定性均优于K?Means聚类算法和高斯核K-Means聚类算法。NTKKM聚类算法与传统的K-Means聚类算法相比,准确率分别提升了14.9%和9.4%,ARI分别提升了9.7%和18.0%,FM指数分别提升了12.0%和12.0%,验证了NTKKM聚类算法良好的聚类性能。
|
关 键 词: | 神经正切核 K?Means 核聚类 特征空间 核函数 |
收稿时间: | 2021-11-17 |
修稿时间: | 2021-12-13 |
|
| 点击此处可从《计算机应用》浏览原始摘要信息 |
|
点击此处可从《计算机应用》下载全文 |
|