基于MapReduce的海量数据挖掘技术研究 Research on massive data mining based on MapReduce期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

基于MapReduce的海量数据挖掘技术研究

引用本文：	李伟卫,赵航,张阳,王勇.基于MapReduce的海量数据挖掘技术研究[J].计算机工程与应用,2013,49(20):112-117.

作者姓名：	李伟卫赵航张阳王勇

作者单位：	1.西北农林科技大学信息工程学院，陕西杨凌 712100 2.西安电子科技大学机电工程学院，西安 710072 3.西北工业大学计算机学院，西安 710072

基金项目：	国家自然科学基金(No.60873196)；中央高校基本科研业务费专项资金(No.QN2009092)。

摘要：	MapReduce是一种编程模型，可以运行在异构环境下，编程简单，不必关心底层实现细节，用于大规模数据集的并行运算。将MapReduce应用在数据挖掘的三个算法中：朴素贝叶斯分类算法、K-modes聚类算法和ECLAT频繁项集挖掘算法。实验结果表明，在保证算法准确率的前提下，MapReduce可以有效提高海量数据挖掘工作的效率。
关键词：	云计算数据挖掘 Hadoop MapReduce
Research on massive data mining based on MapReduce

LI Weiwei , ZHAO Hang , ZHANG Yang , WANG Yong.Research on massive data mining based on MapReduce[J].Computer Engineering and Applications,2013,49(20):112-117.

Authors:	LI Weiwei ZHAO Hang ZHANG Yang WANG Yong

Affiliation:	1.College of Information Engineering, Northwest A&F University, Yangling, Shaanxi 712100, China 2.School of Mechano-Electronic Engineering, Xidian University, Xi’an 710072, China 3.School of Computer, Northwestern Polytechnical University, Xi’an 710072, China

Abstract:	MapReduce is a programming model which can run in a heterogeneous environment for mining massive volume of data. It is simple to be implemented without paying attention to the underlying details and can be used for large-scale parallel computing. In this paper, three data mining algorithms, Naive Bayes, K-modes, ECLAT are implemented by employing the MapReduce programming model. The results indicate that MapReduce can perform the data mining tasks on massive volume of data efficiently.

Keywords:	cloud computing data mining Hadoop MapReduce
本文献已被万方数据等数据库收录！
	点击此处可从《计算机工程与应用》浏览原始摘要信息
	点击此处可从《计算机工程与应用》下载全文

设为首页 | 免责声明 | 关于勤云 | 加入收藏