首页 | 本学科首页   官方微博 | 高级检索  
     

基于混合采样的非平衡数据集分类研究
引用本文:古平,欧阳源遊. 基于混合采样的非平衡数据集分类研究[J]. 计算机应用研究, 2015, 0(2): 379-381,418
作者姓名:古平  欧阳源遊
作者单位:重庆大学 计算机学院,重庆,400030
基金项目:重庆市自然科学基金资助项目
摘    要:针对传统的过采样算法在增加样本的同时可能使决策域变小和噪声点增加的问题进行了研究,提出了一种基于错分的混合采样算法。该算法是以SVM为元分类器,Ada Boost算法进行迭代,对每次错分的样本点根据其空间近邻关系,采取一种改进的混合采样策略:对噪声样本直接删除;对危险样本约除其近邻中的正类样本;对安全样本则采用SMOTE算法合成新样本并加入到新的训练集中重新训练学习。在实际数据集上进行实验,并与SMOTE-SVM和Ada Boost-SVM-OBMS算法进行比较,实验结果表明该算法能够有效地提高负类的分类准确率。

关 键 词:混合采样  错分样本  非平衡数据集  Ada Boost算法  支持向量机算法

Classification research for unbalanced data based on mixed-sampling
GU Ping,OU YANG Yuan-you. Classification research for unbalanced data based on mixed-sampling[J]. Application Research of Computers, 2015, 0(2): 379-381,418
Authors:GU Ping  OU YANG Yuan-you
Affiliation:GU Ping;OU YANG Yuan-you;College of Computer Science,Chongqing University;
Abstract:
Keywords:mixed-sampling  misclassified samples  unbalanced data  AdaBoost algorithm  SVM algorithm
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号