首页 | 本学科首页   官方微博 | 高级检索  
     

一种基于欠采样的不平衡数据分类算法
作者姓名:程险峰  李军  李雄飞
作者单位:1. 长春市公安局交通警察支队,长春,130011
2. 长春理工大学数学系,长春,130022;吉林大学符号计算与知识工程教育部重点实验室,长春,130012
3. 吉林大学符号计算与知识工程教育部重点实验室,长春,130012
基金项目:国家科技支撑计划基金资助项目,公安部重点科研基金资助项目(B类),吉林省科技发展计划基金资助项目
摘    要:针对不平衡数据学习问题,提出一种基于欠采样的分类算法。对多数类样例进行欠采样,保留位于分类边界附近的多数类样例。以AUC为优化目标,选择最恰当的邻域半径使数据达到平衡,利用欠采样后的样例训练贝叶斯分类器,并采用AUC评价分类器性能。仿真数据及UCI数据集上的实验结果表明,该算法有效。

关 键 词:机器学习  分类算法  不平衡数据  欠采样  邻域
收稿时间:2011-02-25
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机工程》浏览原始摘要信息
点击此处可从《计算机工程》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号