首页 | 本学科首页   官方微博 | 高级检索  
     

基于MapReduce的数据挖掘平台设计与实现
引用本文:黄斌,许舒人,蒲卫.基于MapReduce的数据挖掘平台设计与实现[J].计算机工程与设计,2013,34(2):495-501.
作者姓名:黄斌  许舒人  蒲卫
作者单位:1. 中国科学院软件研究所软件工程技术中心,北京100190;中国科学院研究生院,北京100190
2. 中国科学院软件研究所软件工程技术中心,北京,100190
3. 解放军卫生信息中心,北京,100842
基金项目:国家科技重大专项核高基基金项目(2010ZX01042-001-001-05);国家科技支撑计划基金项目(2012BAH05F02、2011BAH15B03)
摘    要:MapReduce编程模型的简单性和高性价比使得其适用于海量数据的并行处理.然而,MapReduce欠缺对多数据源、组件复用以及数据可视化支持,这些缺点使用户在运用MapReduce框架进行数据挖掘时暴露出开发效率低下,重复开发等问题.提出了一种基于MapReduce的数据挖掘平台的设计与实现,该设计思想为Hadoop作为大规模数据计算平台在数据挖掘、数据可视化以及商业智能应用方面的不足提供了参考与弥补.同时,基于该方法实现了一个大规模数据挖掘工具.

关 键 词:MapReduce编程模型  数据挖掘  Hadoop平台  模型驱动  可视化

Design and implementation of MapReduce-based data mining platform
HUANG Bin , X Shu-ren , PU Wei.Design and implementation of MapReduce-based data mining platform[J].Computer Engineering and Design,2013,34(2):495-501.
Authors:HUANG Bin  X Shu-ren  PU Wei
Affiliation:1.Technology Center of Software Engineering,Institute of Software,Chinese Academy of Sciences, Beijing 100190,China;2.Graduate University,Chinese Academy of Sciences,Beijing 100190,China; 3.Health Information Center of PLA,Beijing 100842,China)
Abstract:
Keywords:
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号