基于持续同调改进的KNN拓扑分类算法 |
| |
引用本文: | 詹学燕,彭宁宁,殷杏子.基于持续同调改进的KNN拓扑分类算法[J].武汉理工大学学报,2023(3):146-155. |
| |
作者姓名: | 詹学燕 彭宁宁 殷杏子 |
| |
作者单位: | 武汉理工大学理学院 |
| |
基金项目: | 国家自然科学基金(11701438); |
| |
摘 要: | 针对传统KNN算法性能受到所采用的相似度或距离度量方法影响大,且传统几何度量无法有效度量相似性的问题,提出一种采用拓扑相似度的KNN分类算法。首先将训练集与测试集中的数据集转化为单独的持久性图,利用拓扑数据分析(TDA)中的持续同调来提取隐藏在数据集中的重要拓扑特征,然后使用拓扑相似性度量Wasserstein距离对持久性图进行量化,最后再通过改进的K近邻机器学习算法对Wasserstein距离矩阵进行分类。从而实现不同于几何距离相似度或距离度量的拓扑分类算法。通过在UCI数据库进行实验,结果表明:与传统KNN分类算法相比,所提算法的平均精确率和F1值分别提高3.11%和2.62%,相比于其它4种改进的KNN分类方法,其准确率分别平均提高1.05%~5.95%,其F1值分别平均提高2.24%~5%,表明所提算法能够显著提高分类效果。
|
关 键 词: | 拓扑数据分析 持续同调 Wasserstein距离 持久性图 KNN |
|
|