首页 | 本学科首页   官方微博 | 高级检索  
     

一种面向高维数据的迭代式Lasso特征选择方法*
引用本文:施万锋,胡学钢,俞奎.一种面向高维数据的迭代式Lasso特征选择方法*[J].计算机应用研究,2011,28(12):4463-4466.
作者姓名:施万锋  胡学钢  俞奎
作者单位:合肥工业大学计算机与信息学院,合肥,230009
基金项目:国家自然科学基金资助项目(60975034);合肥工业大学“千人计划”团队专项基金资助项目(2010hgxj0717)
摘    要:Lasso方法与其他特征选择一样,对高维海量或高维小样本数据集的特征选择容易出现计算开销过大或过学习问题(过拟合).为解决此问题,提出一种改进的Lasso方法:迭代式Lasso方法.迭代式Lasso方法首先将特征集分成K份,对第一份特征子集进行特征提取,将所得特征加入第二份,再对第二份特征进行特征提取;然后将所得特征加入第三份,依次迭代下去,直到第K份,得到最终特征子集.实验表明,迭代式Lasso方法能够很好地对高维海量或高维小样本数据集进行特征选择,是一种有效的特征选择方法.目前,此方法已经很好地应用在高维海量和高维小样本数据的分类或预测模型中.

关 键 词:Lasso  特征选择  迭代式Lasso

Iterative Lasso based on feature selection for high dimensional data
SHI Wan-feng,HU Xue-gang,YU Kui.Iterative Lasso based on feature selection for high dimensional data[J].Application Research of Computers,2011,28(12):4463-4466.
Authors:SHI Wan-feng  HU Xue-gang  YU Kui
Affiliation:SHI Wan-feng,HU Xue-gang,YU Kui(School of Computer & Information,Hefei University of Technology,Hefei 230009,China)
Abstract:With a high-dimensional and large dataset,like other feature selection methods,Lasso encounters the problems of large computation and overfitting.To address this issue,this paper proposed an improved Lasso method:iterative Lasso method.Iterative Lasso method first divided the feature set into K copies.Then it selected the features from the first feature subset,put the selected features into the second feature subset,and continued this iteration until up to the Kth feature subset.Experimental results show th...
Keywords:Lasso  feature selection  iterative Lasso  
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《计算机应用研究》浏览原始摘要信息
点击此处可从《计算机应用研究》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号