首页 | 官方网站   微博 | 高级检索  
     

基于特征相关性的特征选择
引用本文:蒋盛益,王连喜.基于特征相关性的特征选择[J].计算机工程与应用,2010,46(20):153-156.
作者姓名:蒋盛益  王连喜
作者单位:1. 广东外语外贸大学,信息学院,广州,510006
2. 广东外语外贸大学,国际工商管理学院,广州,510006
基金项目:国家自然科学基金,广东省自然科学基金,广东省高等学校自然科学研究重点项目 
摘    要:提出了一种基于特征相关性的特征选择方法。该方法以特征之间相互依赖程度(相关度)为聚类依据先对特征进行聚类,再从各特征簇中挑选出具有代表性的特征,然后在被选择出来的特征中删除与目标特征无关或是弱相关的特征,最后留下的特征作为最终的特征子集。理论分析表明该方法的运算效率高,时间复杂度低,适合于大规模数据集中的特征选择。在UCI数据集上与文献中的经典方法进行实验比较和分析,结果显示提出的特征选择方法在特征约减和分类等方面具有更好的性能。

关 键 词:特征选择  相关度  特征聚类  分类
收稿时间:2010-4-14
修稿时间:2010-5-20  

Feature selection based on feature similarity measure
JIANG Sheng-yi,WANG Lian-xi.Feature selection based on feature similarity measure[J].Computer Engineering and Applications,2010,46(20):153-156.
Authors:JIANG Sheng-yi  WANG Lian-xi
Affiliation:1.School of Informatics,Guangdong University of Foreign Studies,Guangzhou 510006,China; 2.School of Management,Guangdong University of Foreign Studies,Guangzhou 510006,China )
Abstract:This paper proposes a feature selection algorithm based on feature similarity measure.The method clusters features based on similarity measure and then chooses representative features from each cluster.At last,the feature subset is selected by removing the feature which is less relevant or irrelevant to class feature.Theory analysis indicates that the method with lower time complexity can be applied in feature selection for high dimensional data.The superiority of the algorithm,in terms of dimensionality reduction and classification performance,is established extensively over UCI datasets through comparing with other classic feature selection approaches.
Keywords:feature selection  similarity  feature clustering  classification
本文献已被 维普 万方数据 等数据库收录!
点击此处可从《计算机工程与应用》浏览原始摘要信息
点击此处可从《计算机工程与应用》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号