集成特征选择的最优化支持向量机分类器模型研究 |
| |
作者姓名: | 赵宇 陈锐 刘蔚 |
| |
作者单位: | 中国科学院科技政策与管理科学研究所 北京100190,中国科学院科技政策与管理科学研究所 北京100190,中国科学院科技政策与管理科学研究所 北京100190;中国科学院大学 北京100049 |
| |
基金项目: | 本文受2013质检公益性行业科研专项课题(201310118),2015国家质检公益性行业科研专项课题(201510041),中科院重大任务专项课题(Y201161Z04)资助 |
| |
摘 要: | 考虑将特征选择集成到支持向量机分类器中,提出集成特征选择的最优化支持向量机分类器——FS-SDP-SVM(Feature Selection in Semi-definite Program for Support Vector Machine)。该模型将每个特征分别在核空间中做特征映射,然后通过参数组合构成新的核矩阵,将特征选择过程与机器分类过程统一在一个优化目标下,同时达到特征选择与分类最优。在特征筛选方面,根据模型参数提出用于特征筛选的特征支持度和特征贡献度,通过控制二者的上下限可以在最优分类和最少特征之间灵活取舍。实证中分别将最优分类(FS-SDP-SVM1)和最少特征(FS-SDP-SVM2)两类集成化特征选择算法与Relief-F、SFS、SBS算法在UCI机器学习数据和人造数据中进行对比实验。结果表明,提出的FS-SDP-SVM算法在保持较好泛化能力的基础上,在多数实验数据集中实现了最大分类准确率或最少特征数量;在人工数据中,该方法可以准确地选出真正的特征,去除噪声特征。
|
关 键 词: | 特征选择 集成化方法 支持向量机分类器 特征核子空间 半正定规划 |
收稿时间: | 2015-07-21 |
修稿时间: | 2015-10-16 |
|
|