首页 | 本学科首页   官方微博 | 高级检索  
     

基于Hadoop集群的多表并行关联算法及应用
引用本文:郑晓薇,马琳. 基于Hadoop集群的多表并行关联算法及应用[J]. 微型机与应用, 2013, 32(4): 91-93
作者姓名:郑晓薇  马琳
作者单位:辽宁师范大学计算机与信息技术学院,辽宁大连,116081
摘    要:
针对因特网环境下并行数据库实现多个大数据表关联存在的计算瓶颈,基于Hadoop集群设计了一个并行关联多个大数据表的简便算法MR_Join。以商业网站凡客诚品的销售数据为例进行实验,验证算法的可行性并做出应用实例。实验结果表明,MR_Join算法可以有效地实现大数据表的快速关联,具有显著的并行效率。

关 键 词:Hadoop集群  Mapreduce编程模式  MR_Join算法  数据表并行关联

Multi-chart parallel correlation algorithm and application based on the Hadoop cluster
Zheng Xiaowei , Ma Lin. Multi-chart parallel correlation algorithm and application based on the Hadoop cluster[J]. Microcomputer & its Applications, 2013, 32(4): 91-93
Authors:Zheng Xiaowei    Ma Lin
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号