当前位置:   article > 正文

Hadoop生态集群快速搭建(Powerd by Docker、Ambari)_ambari docker 安装

ambari docker 安装

本篇Blog转载于我个人博客: https://jarlor.github.io/2023/10/15/hadoop-on-docker/

序言

在大数据领域,Hadoop生态系统是目前最受欢迎的大数据处理框架,它包括Hadoop、Hive、HBase、Spark、Flink等多个关键组件,这些组件可以协同工作,建立出一个全面的大数据处理系统。
但是,这些组件的安装和配置(完全分布式集群)是一件非常繁琐的事情。对于想入门大数据,创建一个学习用的大数据环境的同学来说,无疑是一道难以逾越的鸿沟。
本文将介绍如何使用DockerAmbari,在一台主机上快速搭建Hadoop生态集群。

特别提醒

本环境搭建下的hadoop生态集群供学习使用,为降低搭建难度,作者刻意弱化了集群安全性部署,故该集群不适用于生产环境。

前置准备

一台Ubuntu系统的Linux宿主机(支持虚拟机)

  1. 最低内存 6 G。
  2. 最低存储 50 G。
  3. 已经安装并配置好 docker。
  4. 已经安装并配置好git。
  5. 已配置好静态IP。
  6. 可联网(最好可连外网)。

克隆Github仓库到Linux宿主机

  1. 这里提供github仓库地址:https://github.com/jarlor/hadoop_on_docker.git
  2. 下文的一切操作都将基于克隆下来的仓库所在目录

下载相关离线软件(资源比较多,约7G)

  1. 这里提供百度网盘链接:https://pan.baidu.com/s/1gTkuPH_IdcZBvwzAK4Ew-A?pwd=here

    注:HDP标准版的软件包远大于此,为进一步精简该包,本下载链接只保留了大数据标准组件。如需更多组件,请去此链接下载。

  2. 请将文件下载到上一步克隆下来的仓库目录下的software/文件夹下。举例如下图:

Ambari配置与安装

编辑全局环境配置

本小节的目的是配置脚本运行环境必要的参数,涉及到的文件是 hadoop_on_docker/cluster_config

请根据注释填写相关配置项。

#集群参数配置


#本机ip
export host_ip='192.168.100.100'
#网卡名
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/羊村懒王/article/detail/647449
推荐阅读
相关标签
  

闽ICP备14008679号