首页 | 本学科首页   官方微博 | 高级检索  
     

具有Fisher一致性的代价敏感Boosting算法
引用本文:曹莹,苗启广,刘家辰,高琳.具有Fisher一致性的代价敏感Boosting算法[J].软件学报,2013,24(11):2584-2596.
作者姓名:曹莹  苗启广  刘家辰  高琳
作者单位:西安电子科技大学 计算机学院, 陕西 西安 710071;西安电子科技大学 计算机学院, 陕西 西安 710071;西安电子科技大学 计算机学院, 陕西 西安 710071;西安电子科技大学 计算机学院, 陕西 西安 710071
基金项目:国家自然科学基金(61072109,61272280,41271447,61272195);新世纪优秀人才支持计划(NCET-12-0919);西安市科技局项目(CXY1341(6));中央高校基本科研业务费专项资金(K5051203020,K5051203001,K5051303016,K5051303018,K50513100006)
摘    要:AdaBoost 是一种重要的集成学习元算法,算法最核心的特性“Boosting”也是解决代价敏感学习问题的有效方法.然而,各种代价敏感Boosting 算法,如AdaCost、AdaC 系列算法、CSB 系列算法等采用启发式策略,向AdaBoost 算法的加权投票因子计算公式或权值调整策略中加入代价参数,迫使算法聚焦于高代价样本.然而,这些启发式策略没有经过理论分析的验证,对原算法的调整破坏了AdaBoost 算法最重要的Boosting 特性。AdaBoost算法收敛于贝叶斯决策,与之相比,这些代价敏感Boosting 并不能收敛到代价敏感的贝叶斯决策.针对这一问题,研究严格遵循Boosting 理论框架的代价敏感Boosting 算法.首先,对分类间隔的指数损失函数以及Logit 损失函数进行代价敏感改造,可以证明新的损失函数具有代价意义下的Fisher 一致性,在理想情况下,优化这些损失函数最终收敛到代价敏感贝叶斯决策;其次,在Boosting 框架下使用函数空间梯度下降方法优化新的损失函数得到算法AsyB以及AsyBL.二维高斯人工数据上的实验结果表明,与现有代价敏感Boosting 算法相比,AsyB 和AsyBL 算法能够有效逼近代价敏感贝叶斯决策;UCI 数据集上的测试结果也进一步验证了AsyB 以及AsyBL 算法能够生成有更低错分类代价的代价敏感分类器,并且错分类代价随迭代呈指数下降.

关 键 词:代价敏感学习  贝叶斯决策  Fisher  一致性  AdaBoost  二分类
收稿时间:2013/5/31 0:00:00
修稿时间:2013/7/17 0:00:00

Fisher Consistent Cost Sensitive Boosting Algorithm
CAO Ying,MIAO Qi-Guang,LIU Jia-Chen and GAO Lin.Fisher Consistent Cost Sensitive Boosting Algorithm[J].Journal of Software,2013,24(11):2584-2596.
Authors:CAO Ying  MIAO Qi-Guang  LIU Jia-Chen and GAO Lin
Affiliation:School of Computer Science and Technology, Xidian University, Xi'an 710071, China;School of Computer Science and Technology, Xidian University, Xi'an 710071, China;School of Computer Science and Technology, Xidian University, Xi'an 710071, China;School of Computer Science and Technology, Xidian University, Xi'an 710071, China
Abstract:
Keywords:cost sensitive learning  Bayes decision  Fisher consistent  AdaBoost  binary classification
点击此处可从《软件学报》浏览原始摘要信息
点击此处可从《软件学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号