首页 | 本学科首页   官方微博 | 高级检索  
     

基于改进SMOTE的软件缺陷预测
引用本文:张丽,沈雅婷,朱园园.基于改进SMOTE的软件缺陷预测[J].计算机工程与设计,2023(10):2965-2972.
作者姓名:张丽  沈雅婷  朱园园
作者单位:南京理工大学紫金学院计算机学院
基金项目:江苏省高等学校基础科学(自然科学)研究基金项目(21KJB520009);;江苏高校哲学社会科学研究基金项目(2021SJA2257、2023SJYB0677);
摘    要:为解决软件缺陷预测中的不平衡问题,提出一种基于聚类少数类的改进SMOTE算法。对训练集中的少数类样本进行K-means聚类后,通过关键特征权重及与簇心距离权重,计算每个样本的合成样本数量,采用改进的SMOTE算法实现过抽样。采用CART决策树作为基分类器,使用AdaBoost算法对平衡数据集训练,得到分类模型CSMOTE-AdaBoost。在7组NASA数据集上进行实验,验证分类模型中关键特征权重及与簇心距离权重的有效性,其结果优于传统分类算法,具有更好的分类效果。

关 键 词:缺陷预测  分类不平衡  聚类少数类  关键特征权重  过采样  合成少数类过采样技术  集成学习
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号