首页 | 本学科首页   官方微博 | 高级检索  
     

一种基于核SMOTE的非平衡数据集分类方法
引用本文:曾志强,吴群,廖备水,高济.一种基于核SMOTE的非平衡数据集分类方法[J].电子学报,2009,37(11):2489-2495.
作者姓名:曾志强  吴群  廖备水  高济
作者单位:1. 厦门理工学院计算机科学与技术系,福建厦门,361024;浙江大学计算机科学与技术学院,浙江杭州,310027
2. 浙江大学计算机科学与技术学院,浙江杭州,310027
基金项目:国家自然科学基金项目,福建省青年人才项目 
摘    要: 本文提出一种基于核SMOTE(Synthetic Minority Over-sampling Technique)的分类方法来处理支持向量机(SVM)在非平衡数据集上的分类问题.其核心思想是首先在特征空间中采用核SMOTE方法对少数类样本进行上采样,然后通过输入空间和特征空间的距离关系寻找所合成样本在输入空间的原像,最后再采用SVM对其进行训练.实验表明,核SMOTE方法所合成的样本质量高于SMOTE算法,从而有效提高SVM在非平衡数据集上的分类效果.

关 键 词:非平衡数据集  支持向量机  输入空间  特征空间  原像
收稿时间:2009-02-24

A Classfication Method For Imbalance Data Set Based on Kernel SMOTE
ZENG Zhi-qiang,WU Qun,LIAO Bei-shui,GAO Ji.A Classfication Method For Imbalance Data Set Based on Kernel SMOTE[J].Acta Electronica Sinica,2009,37(11):2489-2495.
Authors:ZENG Zhi-qiang  WU Qun  LIAO Bei-shui  GAO Ji
Affiliation:ZENG Zhi-qiang1,2,WU Qun2,LIAO Bei-shui2,GAO Ji2(1.Department of Computer Science and Technology,Xiamen University of Technology,Xiamen,Fujian 361024,China,2.College of Computer Science and Technology,Zhejiang University,Hangzhou,Zhejiang 310027,China)
Abstract:An approach based on kernel SMOTE(Synthetic Minority Over-sampling Technique) to solve classification on imbalance data set by Support Vector Machine(SVM) is presented.The method first oversamples the minority class in feature space by kernel SMOTE algorithm,then the pre-images of the synthetic instances are found based on a distance relation between feature space and input space.Finally,these pre-images are appended to the original data set to train a SVM.Experiments on real data sets indicate that compare...
Keywords:imbalance data set  support vector machine  input space  feature space  pre-image
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《电子学报》浏览原始摘要信息
点击此处可从《电子学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号