首页 | 本学科首页   官方微博 | 高级检索  
     

混合存储下的MapReduce启发式多表连接优化
引用本文:王梅,邢露露,孙莉.混合存储下的MapReduce启发式多表连接优化[J].计算机科学与探索,2014(11):1334-1344.
作者姓名:王梅  邢露露  孙莉
作者单位:东华大学 计算机科学与技术学院,上海,201620
基金项目:The National Natural Science Foundation of China under Grant No.61103046,the Fundamental Research Funds for the Central Universities of China,the Distinguished Young Professor Program of Donghua University under Grant No. B201312
摘    要:对Map Reduce下的多表连接查询进行了研究,发现由于Map Reduce框架本身的局限性,造成执行效率较低。针对此问题,提出了Map Reduce启发式多表连接优化方法(Map Reduce based heuristic multi-join optimization,MHMO),为不同的连接模式启发式地推荐不同的执行算法。特别的,对于混合连接,首先将其分组为多个简单连接模式,进而定义代价模型确定各分组的最优执行顺序。结合列存储的延迟物化技术,大大提高了Map Reduce下多表连接的执行性能。最后,在数据仓库基准测试数据集TPCH上进行了实验,验证了MHMO的有效性。

关 键 词:Map  Reduce  行列混合存储  延迟物化  多表连接优化

MapReduce Based Heuristic Multi-Join Optimization under Hybrid Storage
WANG Mei,XING Lulu,SUN Li.MapReduce Based Heuristic Multi-Join Optimization under Hybrid Storage[J].Journal of Frontier of Computer Science and Technology,2014(11):1334-1344.
Authors:WANG Mei  XING Lulu  SUN Li
Affiliation:WANG Mei;XING Lulu;SUN Li;School of Computer Science and Technology, Donghua University;
Abstract:
Keywords:MapReduce  row-column storage  deferred materialized  multi-join optimization
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号