首页 | 本学科首页   官方微博 | 高级检索  
     

基于MapReduce的特征选择并行化研究
引用本文:陆江,李云. 基于MapReduce的特征选择并行化研究[J]. 计算机科学, 2015, 42(8): 44-47, 81
作者姓名:陆江  李云
作者单位:南京邮电大学计算机学院 南京210023,南京邮电大学计算机学院 南京210023
基金项目:本文受江苏省自然科学基金(BK20131378),国家自然科学基金(61105082)资助
摘    要:特征选择已经成为一种对高维数据进行预处理的必不可少的手段。随着数据规模的爆炸性增长,传统的特征选择算法已经不能满足当前高维大规模数据的处理要求。采用Google的MapReduce编程模型,设计了一种分布式的基于局部学习的特征选择算法D-logsf。在多个现实和合成数据集上的实验表明,分布式特征选择算法D-logsf具有较好的可靠性,且与传统特征选择算法Logsf相比可以获得接近线性的加速比,同时可以有效处理大规模数据集。

关 键 词:特征选择  局部学习  分布式  MapReduce

MapReduce Based Feature Selection Parallelization
LU Jiang and LI Yun. MapReduce Based Feature Selection Parallelization[J]. Computer Science, 2015, 42(8): 44-47, 81
Authors:LU Jiang and LI Yun
Affiliation:College of Computer Science,Nanjing University of Posts and Telecommunications,Nanjing 210023,China and College of Computer Science,Nanjing University of Posts and Telecommunications,Nanjing 210023,China
Abstract:
Keywords:Feature selection  Local learning  Distributed  MapReduce
本文献已被 万方数据 等数据库收录!
点击此处可从《计算机科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号