首页 | 本学科首页   官方微博 | 高级检索  
     

多类不平衡数据分类方法综述
引用本文:李昂,韩萌,穆栋梁,高智慧,刘淑娟.多类不平衡数据分类方法综述[J].计算机应用研究,2022,39(12).
作者姓名:李昂  韩萌  穆栋梁  高智慧  刘淑娟
作者单位:北方民族大学计算机科学与工程学院,北方民族大学计算机科学与工程学院,北方民族大学计算机科学与工程学院,北方民族大学计算机科学与工程学院,北方民族大学计算机科学与工程学院
基金项目:国家自然科学基金资助项目(62062004);宁夏自然科学基金资助项目(2020AAC03216,2022AAC03279);北方民族大学研究生创新项目(YCX22191)
摘    要:现实中许多领域产生的数据通常具有多个类别并且是不平衡的。在多类不平衡分类中,类重叠、噪声和多个少数类等问题降低了分类器的能力,而有效解决多类不平衡问题已经成为机器学习与数据挖掘领域中重要的研究课题。根据近年来的多类不平衡分类方法的文献,从数据预处理和算法级分类方法两方面进行了分析与总结,并从优缺点和数据集等方面对所有算法进行了详细的分析。在数据预处理方法中,介绍了过采样、欠采样、混合采样和特征选择方法,对使用相同数据集算法的性能进行了比较。从基分类器优化、集成学习和多类分解技术三个方面对算法级分类方法展开介绍和分析。最后对多类不平衡数据分类研究领域的未来发展方向进行总结归纳。

关 键 词:分类    多类不平衡数据    数据预处理方法    算法级分类方法
收稿时间:2022/3/29 0:00:00
修稿时间:2022/11/17 0:00:00

Survey of multi-class imbalanced data classification methods
Li Ang,Han Meng,Mu Dongliang,Gao Zhihui and Liu Shujuan.Survey of multi-class imbalanced data classification methods[J].Application Research of Computers,2022,39(12).
Authors:Li Ang  Han Meng  Mu Dongliang  Gao Zhihui and Liu Shujuan
Affiliation:School of Computer Science and Engineering, North Minzu University,,,,
Abstract:In reality, the data generated in many fields usually have multiple classes and are imbalanced. In multi-class imbalance classification, problems such as class overlap, noise and multiple minority classes reduce the capability of classifiers, and effective solution of multi-class imbalance problem has become an important research topic in the field of machine learning and data mining. Based on the recent literature on multi-class imbalance classification methods, this paper analyzed and summarized both data preprocessing and algorithm-level classification methods, and conducted a detailed analysis of all algorithms in terms of advantages, disadvantages and data sets. The data preprocessing methods introduced oversampling, undersampling, hybrid sampling and feature selection methods to compare the performance of the algorithms using the same datasets. In addition, the algorithm-level classification methods described and analyzed base classifier optimization, ensemble learning and multi-class decomposition techniques. Finally, this paper summarized the future development directions of the multi-class imbalanced data classification research field.
Keywords:classification  multi-class imbalance data  data preprocessing method  algorithm-level classification method
点击此处可从《计算机应用研究》浏览原始摘要信息
点击此处可从《计算机应用研究》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号