基于Hadoop平台的分布式ETL系统设计与实现 |
| |
引用本文: | 李晨翔,何刚,孙莉.基于Hadoop平台的分布式ETL系统设计与实现[J].福建电脑,2013(11):111-114. |
| |
作者姓名: | 李晨翔,何刚,孙莉 |
| |
作者单位: | 东华大学计算机科学与技术学院,上海201620 |
| |
摘 要: | 为了解决传统的抽取、转换和加栽工具处理数据仓库中海量数据的效率问题,设计并实现了基于Hadoop平台的分布式ETL系统。详细的探讨了渐变维度、雪花维度、大维度数据和事实数据的并行处理。实验结果表明,与Hive数据仓库相比,该分布式ETL系统在并行处理数据仓库中海量数据的问题上,具有更高的效率和扩展性。
|
关 键 词: | Hadoop 分布式ETL 维度 事实 并行处理 |
本文献已被 维普 等数据库收录! |
|