基于Docker的Hadoop完全分布式集群快速部署 |
| |
引用本文: | 胡必波,刘钟凌,刘晓娟,焦花花.基于Docker的Hadoop完全分布式集群快速部署[J].无线互联科技,2022(12):141-145. |
| |
作者姓名: | 胡必波 刘钟凌 刘晓娟 焦花花 |
| |
作者单位: | 广州工商学院工学院 |
| |
摘 要: | Docker是Paas提供商dotcloud公司研发的一个基于LXC的高级容器引擎,具有一次构建,到处运行优势。当前在Hadoop技术的发展中,如何把Docker技术应用于Hadoop平台的建立,尤其是对于Hadoop on Docker规模部署问题的解决,一直是一个备受关注的技术难点。针对以上问题,文章提出基于Docker的一键部署Hadoop7层解决方案,首先从Docker环境部署入手,简要介绍了镜像部署以及容器部署的过程,重点分析并实现了Hadoop集群(HDFS+YARN)的一键部署方法,并通过bind mounts(绑定挂载)方式解决了集群数据存储问题,给出关键脚本代码的实现过程。实践表明,Hadoop on Docker规模一键快速部署具有灵活方便、开销小、效率高、可扩展性强等优势,提高了Hadoop大数据技术学习和生产环境部署效率。
|
关 键 词: | Docker Hadoop 镜像 容器 仓库 |
|
|