首页 | 本学科首页   官方微博 | 高级检索  
     

基于Lévy分布的不平衡数据过采样方法
作者姓名:张扬帆  张海鹏  孙俊
作者单位:江南大学 物联网工程学院,江苏 无锡,214122;江南大学 物联网工程学院,江苏 无锡,214122;江南大学 物联网工程学院,江苏 无锡,214122
摘    要:针对不平衡数据集上的分类问题,提出了基于Lévy分布的过采样方法,其核心思想是根据初始数据集的分布,利用Lévy分布构造新样本的密度分布。基于Lévy分布的特性,使得从边界样本合成的新样本密度最大,靠近多数类的样本合成的新样本密度次之,靠近少数类的样本合成的新样本密度最小。因此,该算法可以增强分类边界,同时可以减小噪声生成。通过在多个数据集上的实验,表明所提算法可以有效改善不平衡数据的分类效果。

关 键 词:不平衡分类  Lévy分布  过采样  人工合成过采样技术(SMOTE)
本文献已被 维普 万方数据 等数据库收录!
点击此处可从《计算机工程与应用》浏览原始摘要信息
点击此处可从《计算机工程与应用》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号