首页 | 本学科首页   官方微博 | 高级检索  
     

多类不平衡数据上的分类器性能比较研究
引用本文:倪黄晶,王蔚.多类不平衡数据上的分类器性能比较研究[J].计算机工程,2011,37(10):160-161.
作者姓名:倪黄晶  王蔚
作者单位:南京师范大学教育科学学院机器学习与认知实验室,南京,210097
基金项目:教育部留学回国人员科研启动基金
摘    要:不同的基分类器对不同分布类型的多类别不平衡数据的适应性存在较大差异。为此,针对分类器的选用问题,在分析比较准确率(ACC)及曲线下面积(AUC)的评价标准基础上,选择基于AUC的分类器评价方法,将支持向量机、决策树和贝叶斯分类器应用于标准数据集中,并采用AUC来评价结果,得出相关结论:在多类不平衡数据上,贝叶斯是最好的基分类器,且SVM分类器存在一定改进空间。

关 键 词:多类不平衡数据  基分类器  ROC曲线下面积  准确率

Comparison Research of Classifier Performance on Multi-class Imbalanced Data
NI Huang-jing,WANG Wei.Comparison Research of Classifier Performance on Multi-class Imbalanced Data[J].Computer Engineering,2011,37(10):160-161.
Authors:NI Huang-jing  WANG Wei
Affiliation:(Machine Learning and Cognition Lab,School of Education Science,Nanjing Normal University,Nanjing 210097,China)
Abstract:On different distribution of multi-class imbalanced data,different base classifiers have different adaptability.To aim at the classifier selection problem,based on the analysis and comparison of the evaluation criteria of Accuracy(ACC) and Area Under the ROC(AUC),it chooses AUC to evaluate a classifier and draws the conclusion that Bayesian classifier is the best one and SVM classifier has greater room for improvement,through the experiments on dealing with many different distribution unbalanced data from standard database.
Keywords:multi-class imbalanced data  base classifier  Area Under the ROC(AUC)  Accuracy(ACC)
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机工程》浏览原始摘要信息
点击此处可从《计算机工程》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号