基于Lévy分布的不平衡数据过采样方法 |
| |
作者姓名: | 张扬帆 张海鹏 孙俊 |
| |
作者单位: | 江南大学 物联网工程学院,江苏 无锡,214122;江南大学 物联网工程学院,江苏 无锡,214122;江南大学 物联网工程学院,江苏 无锡,214122 |
| |
摘 要: | 针对不平衡数据集上的分类问题,提出了基于Lévy分布的过采样方法,其核心思想是根据初始数据集的分布,利用Lévy分布构造新样本的密度分布。基于Lévy分布的特性,使得从边界样本合成的新样本密度最大,靠近多数类的样本合成的新样本密度次之,靠近少数类的样本合成的新样本密度最小。因此,该算法可以增强分类边界,同时可以减小噪声生成。通过在多个数据集上的实验,表明所提算法可以有效改善不平衡数据的分类效果。
|
关 键 词: | 不平衡分类 Lévy分布 过采样 人工合成过采样技术(SMOTE) |
本文献已被 维普 万方数据 等数据库收录! |
| 点击此处可从《计算机工程与应用》浏览原始摘要信息 |
|
点击此处可从《计算机工程与应用》下载免费的PDF全文 |
|