首页 | 本学科首页   官方微博 | 高级检索  
     

Borderline-mixup不平衡数据集分类方法
引用本文:吴振煊,郭躬德,王晖. Borderline-mixup不平衡数据集分类方法[J]. 计算机系统应用, 2023, 32(11): 73-82
作者姓名:吴振煊  郭躬德  王晖
作者单位:福建师范大学 计算机与网络空间安全学院, 福州 350117;贝尔法斯特女王大学 电子电气工程和计算机科学学院, 贝尔法斯特 BT9 5BN
基金项目:国家自然科学基金(61976053, 62171131); 福建省自然科学基金(2022J01398)
摘    要:不平衡数据集问题从20年前就已经引起人们的重视, 提出的相关解决方法层出不穷. Mixup是这几年比较流行的数据合成方法, 其相关变体比比皆是, 但是针对不平衡数据集提出的Mixup变体寥寥无几. 本文针对不平衡数据集分类问题, 提出了Mixup的变体——Borderline-mixup, 其使用支持向量机选择边界样本, 增加边界样本在采样器中被采样的概率, 构建两个边界采样器, 替代了原有的随机采样器. 在14个UCI数据集以及CIFAR10长尾数据集上的实验结果表明, Borderline-mixup相比于Mixup在UCI数据集中都有提升, 最高能达到49.3%的提升, 在CIFAR10长尾数据集中, 也能达到3%–3.6%左右的提升. 显然, 我们提出的Mixup变体在不平衡数据集分类中是有效的.

关 键 词:Mixup  支持向量机  不平衡数据集  边界样本  分类
收稿时间:2023-04-30
修稿时间:2023-05-29

Borderline-mixup Imbalanced Data Sets Classification Method
WU Zhen-Xuan,GUO Gong-De,WANG Hui. Borderline-mixup Imbalanced Data Sets Classification Method[J]. Computer Systems& Applications, 2023, 32(11): 73-82
Authors:WU Zhen-Xuan  GUO Gong-De  WANG Hui
Abstract:
Keywords:Mixup  support vector machine (SVM)  imbalanced data sets  boundary samples  classification
点击此处可从《计算机系统应用》浏览原始摘要信息
点击此处可从《计算机系统应用》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号