首页 | 本学科首页   官方微博 | 高级检索  
     

一种用于不平衡数据分类的改进AdaBoost算法
作者姓名:郭乔进  李立斌  李宁
作者单位:南京大学,计算机软件新技术国家重点实验室,南京,210093;南京大学,计算机科学与技术系,南京,210093
摘    要:真实世界中存在大量的类别不平衡分类问题,传统的机器学习算法如AdaBoost算法,关注的是分类器的整体性能,而没有给予小类更多的关注。因此针对类别不平衡学习算法的研究是机器学习的一个重要方向。AsymBoost作为AdaBoost的一种改进算法,用于类别不平衡学习时,牺牲大类样本的识别精度来提高小类样本的分类性能。AsymBoost算法依然可能遭遇样本权重过大造成的过适应问题。据此提出了一种新型的AdaBoost改进算法。该方法通过对大类中分类困难样本的权重和标签进行处理,使分类器能够同时获得较好的查准率和查全率。实验结果表明,该方法可以有效提高在不平衡数据集上的分类性能。

关 键 词:不平衡数据  类别不平衡学习  AdaBoost  AsymBoost  阈值
收稿时间:2008-04-30
修稿时间:2008-5-29  
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《计算机工程与应用》浏览原始摘要信息
点击此处可从《计算机工程与应用》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号