Hadoop生态集群快速搭建(Powerd by Docker、Ambari)_ambari docker 安装

作者：羊村懒王 | 2024-05-30 14:59:08

踩

ambari docker 安装

本篇Blog转载于我个人博客: https://jarlor.github.io/2023/10/15/hadoop-on-docker/

序言

在大数据领域，Hadoop生态系统是目前最受欢迎的大数据处理框架，它包括Hadoop、Hive、HBase、Spark、Flink等多个关键组件，这些组件可以协同工作，建立出一个全面的大数据处理系统。
但是，这些组件的安装和配置(完全分布式集群)是一件非常繁琐的事情。对于想入门大数据，创建一个学习用的大数据环境的同学来说，无疑是一道难以逾越的鸿沟。
本文将介绍如何使用Docker和Ambari，在一台主机上快速搭建Hadoop生态集群。

特别提醒

本环境搭建下的hadoop生态集群供学习使用，为降低搭建难度，作者刻意弱化了集群安全性部署，故该集群不适用于生产环境。

前置准备

一台Ubuntu系统的Linux宿主机(支持虚拟机)

最低内存 6 G。
最低存储 50 G。
已经安装并配置好 docker。
已经安装并配置好git。
已配置好静态IP。
可联网(最好可连外网)。

克隆Github仓库到Linux宿主机

这里提供github仓库地址:https://github.com/jarlor/hadoop_on_docker.git
下文的一切操作都将基于克隆下来的仓库所在目录

下载相关离线软件(资源比较多,约7G)

这里提供百度网盘链接:https://pan.baidu.com/s/1gTkuPH_IdcZBvwzAK4Ew-A?pwd=here

注:HDP标准版的软件包远大于此，为进一步精简该包，本下载链接只保留了大数据标准组件。如需更多组件，请去此链接下载。
请将文件下载到上一步克隆下来的仓库目录下的software/文件夹下。举例如下图:

Ambari配置与安装

编辑全局环境配置

本小节的目的是配置脚本运行环境必要的参数，涉及到的文件是 hadoop_on_docker/cluster_config。

请根据注释填写相关配置项。

#集群参数配置


#本机ip
export host_ip='192.168.100.100'
#网卡名
1
2
3
4
5
6

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/羊村懒王/article/detail/647449