基于特征选择算法的个人信用预测模型 |
| |
作者姓名: | 查志成 梁雪春 |
| |
作者单位: | 南京工业大学 电气工程与控制科学学院,江苏 南京 211816 |
| |
基金项目: | 国家自然科学基金青年基金项目(11801267); |
| |
摘 要: | 针对传统机器学习分类算法处理高维个人信用数据时分类准确率较低的问题,提出一种基于皮尔森相关系数(PCC)和互信息法结合梯度提升决策树(MI-GBDT)的最优特征子集的选择方法,并应用在决策树、朴素贝叶斯分类器、支持向量机上。利用皮尔森相关系数去除强相关特征,利用互信息法和GBDT计算剩余特征的综合重要度,结合改进的基于特征排序的搜索策略,分别生成3种分类器模型所需的最优特征子集。实验结果表明,该方法在3种分类模型上筛选出的特征子集对应的分类精度分别提高了4.33%、13.29%和20.27%。
|
关 键 词: | 信用风险评估 皮尔森相关系数 互信息 梯度提升决策树 搜索策略 |
本文献已被 万方数据 等数据库收录! |
|