首页 | 本学科首页   官方微博 | 高级检索  
     

基于Hadoop平台的分布式ETL系统设计与实现
引用本文:李晨翔,何刚,孙莉.基于Hadoop平台的分布式ETL系统设计与实现[J].福建电脑,2013(11):111-114.
作者姓名:李晨翔,何刚,孙莉
作者单位:东华大学计算机科学与技术学院,上海201620
摘    要:为了解决传统的抽取、转换和加栽工具处理数据仓库中海量数据的效率问题,设计并实现了基于Hadoop平台的分布式ETL系统。详细的探讨了渐变维度、雪花维度、大维度数据和事实数据的并行处理。实验结果表明,与Hive数据仓库相比,该分布式ETL系统在并行处理数据仓库中海量数据的问题上,具有更高的效率和扩展性。

关 键 词:Hadoop  分布式ETL  维度  事实  并行处理
本文献已被 维普 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号