首页 | 本学科首页   官方微博 | 高级检索  
     

基于冗余分析的特征选择算法
引用本文:仇利克,郭忠文,刘青,刘颖健,仇志金.基于冗余分析的特征选择算法[J].北京邮电大学学报,2017,40(1):36-41.
作者姓名:仇利克  郭忠文  刘青  刘颖健  仇志金
作者单位:中国海洋大学 信息科学与工程学院,青岛,266200;中国海洋大学 信息科学与工程学院,青岛,266200;中国海洋大学 信息科学与工程学院,青岛,266200;中国海洋大学 信息科学与工程学院,青岛,266200;中国海洋大学 信息科学与工程学院,青岛,266200
摘    要:针对冗余特征判定难题,分析了特征和特征之间的相关性以及特征和目标值之间相关性的联系,给出了判定冗余特征的准则,在此基础上给出了近似冗余特征的定义,并提出了一种基于冗余分析的特征选择算法.算法分2步去除无关特征和冗余特征.实验结果表明,所提出的特征选择算法能有效降低特征维数,提高预测准确率.

关 键 词:特征选择  相关  冗余  Pearson相关系数  预测

Feature Selection Algorithm Based on Redundancy Analysis
QIU Li-ke,GUO Zhong-wen,LIU Qing,LIU Ying-jian,QIU Zhi-jin.Feature Selection Algorithm Based on Redundancy Analysis[J].Journal of Beijing University of Posts and Telecommunications,2017,40(1):36-41.
Authors:QIU Li-ke  GUO Zhong-wen  LIU Qing  LIU Ying-jian  QIU Zhi-jin
Abstract:Aiming at the problem of redundant feature identification,this article analyzes the internal relationship between two kinds of correlation (correlation between feature and feature,correlation between feature and target value) and provides criterions for redundant feature determination.Approximate redundant feature is defined and a feature selection method based on redundancy is presented thereafter.The algorithm is divided into two steps to remove irrelevant features and redundant features respectively.Simulatios demonstrate that the proposed feature selection algorithms can effectively reduce feature dimension,and improve the accuracy.
Keywords:feature selection  relevance  redundancy  Pearson correlation coefficient  prediction
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号