首页 | 本学科首页   官方微博 | 高级检索  
     

SBFS:基于搜索的软件缺陷预测特征选择框架
引用本文:陈翔,陆凌姣,吉人,魏世鑫.SBFS:基于搜索的软件缺陷预测特征选择框架[J].计算机应用研究,2017,34(4).
作者姓名:陈翔  陆凌姣  吉人  魏世鑫
作者单位:南通大学计算机科学与技术学院 南通 226019,南通大学计算机科学与技术学院 南通 226019,南通大学计算机科学与技术学院 南通 226019,南通大学计算机科学与技术学院 南通 226019
基金项目:国家自然科学基金(61202006),江苏省大学生创新训练计划项目。
摘    要:软件缺陷预测通过预先识别出被测项目内的潜在缺陷程序模块,有助于合理分配测试资源,并最终提高被测软件产品的质量。但在搜集缺陷预测数据集的时候,由于考虑了大量与代码复杂度或开发过程相关的度量元,造成数据集内存在维数灾难问题。借助基于搜索的软件工程思想,提出一种新颖的基于搜索的包裹式特征选择框架SBFS。该框架在实现时,首先借助SMOTE方法来缓解数据集内存在的类不平衡问题,随后借助基于遗传算法的特征选择方法,基于训练集选出最优特征子集。在实证研究中,以NASA数据集作为评测对象,以基于前向选择策略的包裹式特征选择方法FW、基于后向选择策略的包裹式特征选择BW、不进行特征选择的Origin作为基准方法。最终实证研究结果表明:SBFS方法在90%的情况下,不差于Origin法。在82.3%的情况下,不差于BW法。在69.3%的情况下,不差于FW法。除此之外,我们发现若基于决策树分类器,则应用SMOTE方法后,可以在71%的情况下,提高模型性能。而基于朴素贝叶斯和Logistic回归分类器,则应用SMOTE方法后,仅可以在47%和43%的情况下,提高模型的预测性能。

关 键 词:软件缺陷预测    特征选择    基于搜索的软件工程    类不平衡学习
收稿时间:2016/5/5 0:00:00
修稿时间:2017/2/14 0:00:00
点击此处可从《计算机应用研究》浏览原始摘要信息
点击此处可从《计算机应用研究》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号