首页 | 本学科首页   官方微博 | 高级检索  
     

一种适合不平衡数据集的新型提升算法
引用本文:王灿伟,于治楼,张化祥.一种适合不平衡数据集的新型提升算法[J].计算机工程与应用,2011,47(28):169-172.
作者姓名:王灿伟  于治楼  张化祥
作者单位:1.山东师范大学 信息科学与工程学院,济南 2500142.山东工会管理干部学院 信息工程学院,济南 2501003.浪潮集团有限公司,济南 2501014.山东省分布式计算机软件新技术重点实验室,济南 250014
基金项目:山东省科技研究计划项目(No.2007ZZ17,No.2008GG10001015,No.2008B0026,No.ZR2010FM021); 山东省教育厅科研项目(No.J09LG02)
摘    要:提出了一种新的适用于不平衡数据集的Adaboost算法(ILAdaboost),该算法利用每一轮学习到的基分类器对原始数据集进行测试评估,并根据评估结果将原始数据集分成四个子集,然后在四个子集中重新采样形成平衡的数据集供下一轮基分类器学习,由于抽样过程中更加倾向于少数类和分错的多数类,故合成分类器的分界面会偏离少数类。该算法在UCI的10个典型不平衡数据集上进行实验,在保证多数类分类精度的同时提高了少数类的分类精度以及GMA。

关 键 词:不平衡数据集  集成学习  AdaBoost  重采样  
修稿时间: 

New algorithm of AdaBoost for unbalanced datasets
WANG Canwei,YU Zhilou,ZHANG Huaxiang.New algorithm of AdaBoost for unbalanced datasets[J].Computer Engineering and Applications,2011,47(28):169-172.
Authors:WANG Canwei  YU Zhilou  ZHANG Huaxiang
Affiliation:1.Department of Information Science and Engineering,Shandong Normal University,Jinan 250014,China2.Department of Information and Engineering,Shandong Trade Union Cadre Institute,Jinan 250100,China3.Inspur Group,Jinan 250101,China4.Shandong Province Distributed Computer Software New Technique Key Laboratory,Jinan 250014,China
Abstract:A new training method of AdaBoos(tILAdaboost)which is good for unbalanced datasets is proposed in this paper. The algorithm evaluates the original data with the base classifier of each iteration.It divides the original dataset into four subsets,and then re-samples in the four subsets to form the balanced datasets,using for the base classifier learning in the next iteration.Due to the inclination to the minority and the false classified majority in the process of re-sampling,the decision surface in using syn...
Keywords:unbalanced dataset  ensemble learning  AdaBoost  re-sample
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机工程与应用》浏览原始摘要信息
点击此处可从《计算机工程与应用》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号