SBFS:基于搜索的软件缺陷预测特征选择框架 |
| |
引用本文: | 陈翔,陆凌姣,吉人,魏世鑫.SBFS:基于搜索的软件缺陷预测特征选择框架[J].计算机应用研究,2017,34(4). |
| |
作者姓名: | 陈翔 陆凌姣 吉人 魏世鑫 |
| |
作者单位: | 南通大学计算机科学与技术学院 南通 226019,南通大学计算机科学与技术学院 南通 226019,南通大学计算机科学与技术学院 南通 226019,南通大学计算机科学与技术学院 南通 226019 |
| |
基金项目: | 国家自然科学基金(61202006),江苏省大学生创新训练计划项目。 |
| |
摘 要: | 软件缺陷预测通过预先识别出被测项目内的潜在缺陷程序模块,有助于合理分配测试资源,并最终提高被测软件产品的质量。但在搜集缺陷预测数据集的时候,由于考虑了大量与代码复杂度或开发过程相关的度量元,造成数据集内存在维数灾难问题。借助基于搜索的软件工程思想,提出一种新颖的基于搜索的包裹式特征选择框架SBFS。该框架在实现时,首先借助SMOTE方法来缓解数据集内存在的类不平衡问题,随后借助基于遗传算法的特征选择方法,基于训练集选出最优特征子集。在实证研究中,以NASA数据集作为评测对象,以基于前向选择策略的包裹式特征选择方法FW、基于后向选择策略的包裹式特征选择BW、不进行特征选择的Origin作为基准方法。最终实证研究结果表明:SBFS方法在90%的情况下,不差于Origin法。在82.3%的情况下,不差于BW法。在69.3%的情况下,不差于FW法。除此之外,我们发现若基于决策树分类器,则应用SMOTE方法后,可以在71%的情况下,提高模型性能。而基于朴素贝叶斯和Logistic回归分类器,则应用SMOTE方法后,仅可以在47%和43%的情况下,提高模型的预测性能。
|
关 键 词: | 软件缺陷预测 特征选择 基于搜索的软件工程 类不平衡学习 |
收稿时间: | 2016/5/5 0:00:00 |
修稿时间: | 2017/2/14 0:00:00 |
|
| 点击此处可从《计算机应用研究》浏览原始摘要信息 |
|
点击此处可从《计算机应用研究》下载全文 |
|