首页 | 本学科首页   官方微博 | 高级检索  
     

不平衡数据集的分类方法研究
引用本文:王和勇,樊泓坤,姚正安,李成安.不平衡数据集的分类方法研究[J].计算机应用研究,2008,25(5):1301-1303.
作者姓名:王和勇  樊泓坤  姚正安  李成安
作者单位:1. 华南理工大学,电子商务学院,广州,510006
2. 中山大学,数学与计算科学学院,广州,510275
基金项目:国家自然科学基金资助项目(60573161); 西北工业大学研究生创业种子基金资助项目(Z200759)
摘    要:传统的分类算法在处理不平衡数据分类问题时会倾向于多数类,而导致少数类的分类精度较低。针对不平衡数据的分类,首先介绍了现有不平衡数据分类的性能评价;然后介绍了现有常用的基于数据采样的方法及现有的分类方法;最后介绍了基于数据采样和分类方法结合的综合方法。

关 键 词:机器学习  不平衡数据  数据分类
文章编号:1001-3695(2008)05-1301-03
收稿时间:2008/4/20 0:00:00
修稿时间:2007年5月6日

Research of imbalanced data classification
WANG He yong,FAN Hong kun,YAO Zheng an,LI Cheng an.Research of imbalanced data classification[J].Application Research of Computers,2008,25(5):1301-1303.
Authors:WANG He yong  FAN Hong kun  YAO Zheng an  LI Cheng an
Affiliation:(1.College of E business, South China University of Technology, Guangzhou 510006, China; 2. College of Mathematics & Computer Science, Sun Yat sen University, Guangzhou 510275, China)
Abstract:Imbalanced data set cause the deduction of the precision of the minority class samples,when it is classified by traditional algorithm,which can tend to favor the more class samples.In view of the imbalanced data classification,this paper firstly introduced the developed methods that were the performance evaluation of imbalanced data classification.Secondly it presented the developed sampling methods regarding imbalanced data set and produced the classified methods.In the end,it showed the union methods of using sampling method and classified method.
Keywords:machine learning  imbalanced data set  data classification
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机应用研究》浏览原始摘要信息
点击此处可从《计算机应用研究》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号