首页 | 本学科首页   官方微博 | 高级检索  
     

基于持续同调改进的KNN拓扑分类算法
引用本文:詹学燕,彭宁宁,殷杏子.基于持续同调改进的KNN拓扑分类算法[J].武汉理工大学学报,2023(3):146-155.
作者姓名:詹学燕  彭宁宁  殷杏子
作者单位:武汉理工大学理学院
基金项目:国家自然科学基金(11701438);
摘    要:针对传统KNN算法性能受到所采用的相似度或距离度量方法影响大,且传统几何度量无法有效度量相似性的问题,提出一种采用拓扑相似度的KNN分类算法。首先将训练集与测试集中的数据集转化为单独的持久性图,利用拓扑数据分析(TDA)中的持续同调来提取隐藏在数据集中的重要拓扑特征,然后使用拓扑相似性度量Wasserstein距离对持久性图进行量化,最后再通过改进的K近邻机器学习算法对Wasserstein距离矩阵进行分类。从而实现不同于几何距离相似度或距离度量的拓扑分类算法。通过在UCI数据库进行实验,结果表明:与传统KNN分类算法相比,所提算法的平均精确率和F1值分别提高3.11%和2.62%,相比于其它4种改进的KNN分类方法,其准确率分别平均提高1.05%~5.95%,其F1值分别平均提高2.24%~5%,表明所提算法能够显著提高分类效果。

关 键 词:拓扑数据分析  持续同调  Wasserstein距离  持久性图  KNN
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号