首页 | 本学科首页   官方微博 | 高级检索  
     

基于谱聚类的不平衡数据欠采样方法研究
引用本文:杨晓月. 基于谱聚类的不平衡数据欠采样方法研究[J]. 计算机与数字工程, 2021, 49(11): 2305-2309,2330. DOI: 10.3969/j.issn.1672-9722.2021.11.025
作者姓名:杨晓月
作者单位:南京理工大学计算机科学与工程学院 南京 210094
摘    要:不平衡数据的分类问题在数据挖掘和机器学习领域中,一直是备受关注的问题.论文从数据预处理方面出发,提出一种基于谱聚类的欠采样方法,以此来降低数据的不平衡程度.先对多类样本进行谱聚类,根据每个聚类簇的密集程度,以及到少类样本的平均距离,来计算每个聚类簇的采样数目和选取怎样的多类样本,此欠采样方法可以有效去除多数类的冗余数据.实验结果证明,该算法可以有效提升少类样本的分类效果.

关 键 词:不平衡数据  谱聚类  欠采样  支持向量机

Research on Unbalanced Data Under-sampling Method Based on Spectral Clustering
YANG Xiaoyue. Research on Unbalanced Data Under-sampling Method Based on Spectral Clustering[J]. Computer and Digital Engineering, 2021, 49(11): 2305-2309,2330. DOI: 10.3969/j.issn.1672-9722.2021.11.025
Authors:YANG Xiaoyue
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号