首页 | 本学科首页   官方微博 | 高级检索  
     

不平衡数据中基于权重的边界混合采样
引用本文:姜新盈,江开忠,严涛,王舒梵. 不平衡数据中基于权重的边界混合采样[J]. 计算机工程与设计, 2022, 43(5): 1265-1272. DOI: 10.16208/j.issn1000-7024.2022.05.009
作者姓名:姜新盈  江开忠  严涛  王舒梵
作者单位:上海工程技术大学 数理与统计学院,上海 201620
基金项目:全国统计科学研究基金项目(2018LY16);
摘    要:针对单一的不平衡数据分类算法合成样本质量不佳、未考虑类内样本分布等局限性,提出一种不平衡数据中基于权重的边界混合采样(boundary mixed sampling based on weight selection in imbalanced data,BWBMS)。剔除噪声样本并引入边界因子概念,把原样本空间分成边界集和非边界集;考虑类内样本分布,对于边界集中每个少数类样本赋予支持度权重和密度权重并增加采样比重将其划分为两类,对两类样本子集采用不同的过采样算法和过采样倍率;考虑不同区域样本重要性的不同,根据多数类样本距离其最近的k个异类近邻的平均距离来删减部分非边界集多数类样本点。实验结果表明,结合SVM分类器的BWBMS算法在不同数据集上的性能指标得到了提升,验证了其有效性。

关 键 词:不平衡数据  分类  权重  边界因子  混合采样

Boundary mixed sampling based on weight selection in imbalanced data
JIANG Xin-ying,JIANG Kai-zhong,YAN Tao,WANG Shu-fan. Boundary mixed sampling based on weight selection in imbalanced data[J]. Computer Engineering and Design, 2022, 43(5): 1265-1272. DOI: 10.16208/j.issn1000-7024.2022.05.009
Authors:JIANG Xin-ying  JIANG Kai-zhong  YAN Tao  WANG Shu-fan
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号