首页 | 本学科首页   官方微博 | 高级检索  
     

基于MapReduce的海量数据挖掘技术研究
引用本文:李伟卫,赵航,张阳,王勇.基于MapReduce的海量数据挖掘技术研究[J].计算机工程与应用,2013,49(20):112-117.
作者姓名:李伟卫  赵航  张阳  王勇
作者单位:1.西北农林科技大学 信息工程学院,陕西 杨凌 712100 2.西安电子科技大学 机电工程学院,西安 710072 3.西北工业大学 计算机学院,西安 710072
基金项目:国家自然科学基金(No.60873196);中央高校基本科研业务费专项资金(No.QN2009092)。
摘    要:MapReduce是一种编程模型,可以运行在异构环境下,编程简单,不必关心底层实现细节,用于大规模数据集的并行运算。将MapReduce应用在数据挖掘的三个算法中:朴素贝叶斯分类算法、K-modes聚类算法和ECLAT频繁项集挖掘算法。实验结果表明,在保证算法准确率的前提下,MapReduce可以有效提高海量数据挖掘工作的效率。

关 键 词:云计算  数据挖掘  Hadoop  MapReduce  

Research on massive data mining based on MapReduce
LI Weiwei , ZHAO Hang , ZHANG Yang , WANG Yong.Research on massive data mining based on MapReduce[J].Computer Engineering and Applications,2013,49(20):112-117.
Authors:LI Weiwei  ZHAO Hang  ZHANG Yang  WANG Yong
Affiliation:1.College of Information Engineering, Northwest A&F University, Yangling, Shaanxi 712100, China 2.School of Mechano-Electronic Engineering, Xidian University, Xi’an 710072, China 3.School of Computer, Northwestern Polytechnical University, Xi’an 710072, China
Abstract:MapReduce is a programming model which can run in a heterogeneous environment for mining massive volume of data. It is simple to be implemented without paying attention to the underlying details and can be used for large-scale parallel computing. In this paper, three data mining algorithms, Naive Bayes, K-modes, ECLAT are implemented by employing the MapReduce programming model. The results indicate that MapReduce can perform the data mining tasks on massive volume of data efficiently.
Keywords:cloud computing  data mining  Hadoop  MapReduce
本文献已被 万方数据 等数据库收录!
点击此处可从《计算机工程与应用》浏览原始摘要信息
点击此处可从《计算机工程与应用》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号