当前位置:   article > 正文

hadoop记录篇4-mapreduce2(yarn)集群安装和ha高可用_mapreduce2 安装

mapreduce2 安装

一。 yarn架构

    mapreduce从 0.2.3之后 进行了重构, 发布新的mapreduce 版本v2, 也可以称为 yarn 引入了资源调度的概念 之前的JobTracker 被拆分成了 Resouce Manager和ApplicationMaster

  结构上 yarn存在两种类型的节点 主节点称为Resouce Manager(RM) 从节点(执行任务)称为 Node Manager(NM)

  一个yarn应用中只有一个激活的Resouce Manager 每个应用(每个拆分的任务)都有一个ApplitionMaster (AM)所有被提交的job 都会经过 Resouce Manager进行分配  Application Master主要从 Resouce Manager中申请资源 同时监控 每个NodeManager运行任务的状态信息

   ResouceManager包含两个主要控件  Scheduler and ApplicationsManager.

   Scheduler用于分配有限资源给应用 只是调度资源不会监控 资源单位是 Container yarn提供了一些调度的类可供使用 比如CapacityScheduler和 FairScheduler

   ApplicationsManager 用于接收任务的提交 指定哪个NodeManager的ApplicationMaster执行任务 协商ApplicationMaster申请的第一个Container资源 同意后交给调度,

 提供失败后重启ApplicationMaster功能

   NodeManger是一个Container的代理 监控当前机器的cpu 内容 io 网络等 报告这些资源给Resouce Manager 方便统一管理

原理图

     

运行过程:

    1 启动后 每个NodeManager向ResouceManager汇报每个节点的网络 cpu 内存等资源 NodeManager进行汇总  RM的Scheduler 将所有资源

       分成多个Container

    2 客户端提交任务给ResourceManager的ApplicationManager  ApplicationManager调用任务拆分成多个 启用对应NodeManager的ApplicationMaster 调用Scheduler 分配 用于运行Containner ApplicationMaster开始执行任务  

    3 ApplicationMaster监控任务执行状态 并发送心跳给ResourceManager

  

二 。yarn集群安装

  环境 使用之前  hadoop记录篇3-namenode水平拓展Federation+viewfs

机器

  1. /etc/hosts
  2. 192.168.58.147 node1
  3. 192.168.58.149 node2
  4. 192.168.58.150 node3
  5. 192.168.58.151 node4

集群(clusterid:hadoop

  1. namenode
  2. node1 nameserviceid:node1
  3. node2 nameserviceid:node2
  4. secondarynode
  5. node1
  6. node2
  7. DataNodes
  8. node2
  9. node3
  10. node4
  11. Resource Manager
  12. node1
  13. NodeManger
  14. node2
  15. node3
  16. node4
hdfs配置参考前面文章 

进入etc/haddop中 将 mapred-site.xml.template重命名为 mapred-site.xml 添加如下内容

  1. <property>
  2. <name>mapreduce.framework.name</name>
  3. <value>yarn</value>
  4. </property>
yarn-site.xml 添加内容

  1. <property>
  2. <name>yarn.nodemanager.aux-services</name>
  3. <value>mapreduce_shuffle</value>
  4. </property>
  5.  <property>
  6.         <name>yarn.resourcemanager.hostname</name>
  7.         <value>node1</value>
  8.     </property>
以下关于yarn配置 都有默认值 给出意思

  1. yarn.resourcemanager.hostname 表示resourcemanager的主机名
  2. yarn.resourcemanager.address 表示resourcemanger中applicationmanager对外接受提交任务的ip和端口 默认ip本机 端口 ${yarn.resourcemanager.hostname}:8032
  3. yarn.resourcemanager.scheduler.address 表示resoucemanager中Scheduler用于接受NodeManager汇报本地cpu 网络等资源的端口 默认 ${yarn.resourcemanager.hostname}:8030
  4. yarn.resourcemanager.resource-tracker.address 表示nodemanager上用于接受被切片的job的端口 默认 ${yarn.resourcemanager.hostname}:8031
  5. yarn.resourcemanager.webapp.address 用于查看所有提交任务信息的web界面 默认端口 ${yarn.resourcemanager.hostname}:8088
  6. yarn.resourcemanager.admin.address 管理员用于管理资源的端口 默认 ${yarn.resourcemanager.hostname}:8033
  7. yarn.resourcemanager.scheduler.class 调度使用的类 建议使用CapacityScheduler 或者FairScheduler 默认是org.apache.hadoop.yarn.server.resourcemanager.scheduler.capacity.CapacityScheduler
  8. yarn.scheduler.minimum-allocation-mb 每个containner分配的最小内存 默认1024M
  9. yarn.scheduler.maximum-allocation-mb 每个container分配的最大内存 默认 8192M
  10. yarn.nodemanager.resource.memory-mb nodemanger可以使用最大的内存 默认 8192M

NodeManager的所有节点部署的位置和datanode配置是一致的 都是在slaves文件中配置的

启动yarn集群

start-yarn.sh

三。yarn高可用安装

  resourcemanager存在单点故障问题 提供一个standby的备机用于容)

原理:


yarn-site.xml配置(参考http://hadoop.apache.org/docs/r2.6.5/hadoop-yarn/hadoop-yarn-site/ResourceManagerHA.html)

  1. <?xml version="1.0"?>
  2. <!--
  3. Licensed under the Apache License, Version 2.0 (the "License");
  4. you may not use this file except in compliance with the License.
  5. You may obtain a copy of the License at
  6. http://www.apache.org/licenses/LICENSE-2.0
  7. Unless required by applicable law or agreed to in writing, software
  8. distributed under the License is distributed on an "AS IS" BASIS,
  9. WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
  10. See the License for the specific language governing permissions and
  11. limitations under the License. See accompanying LICENSE file.
  12. -->
  13. <configuration>
  14. <!-- Site specific YARN configuration properties -->
  15. <property>
  16. <name>yarn.nodemanager.aux-services</name>
  17. <value>mapreduce_shuffle</value>
  18. </property>
  19. <!--非高可用
  20. <property>
  21. <name>yarn.resourcemanager.hostname</name>
  22. <value>node1</value>
  23. </property>
  24. -->
  25. <!--高可用-->
  26. <property>
  27.    <name>yarn.resourcemanager.ha.enabled</name>
  28.    <value>true</value>
  29.  </property>
  30.  <!--yarn集群编号-->
  31.  <property>
  32.    <name>yarn.resourcemanager.cluster-id</name>
  33.    <value>ha_resouce</value>
  34.  </property>
  35.   <!--高可用中 两个resourcemanager的id-->
  36.  <property>
  37.    <name>yarn.resourcemanager.ha.rm-ids</name>
  38.    <value>rm1,rm2</value>
  39.  </property>
  40.   <!--编号为rm1的主机是node1-->
  41.  <property>
  42.    <name>yarn.resourcemanager.hostname.rm1</name>
  43.    <value>node1</value>
  44.  </property>
  45.   <!--编号为rm2的主机是node2-->
  46.  <property>
  47.    <name>yarn.resourcemanager.hostname.rm2</name>
  48.    <value>node2</value>
  49.  </property>
  50.   <!--配置用于调度的zk所在的服务器和ip  这个安装zk 我直接安装在window上-->
  51.  <property>
  52.    <name>yarn.resourcemanager.zk-address</name>
  53.    <value>192.168.58.1:2181</value>
  54.  </property> 
  55.   <!--自动切换 设置为true-->
  56. <property>
  57. <name>yarn.resourcemanager.ha.automatic-failover.enabled</name>
  58. <value>true</value>
  59. </property>
  60. </configuration>

node1上 执行 start-yarn.sh 不会自动启动node2上的resourcemanager
node2 手工启动 yarn-daemon.sh start resourcemanager


node1上查看rm1和rm2 哪个是active哪个是standby
  1. [root@node1 hadoop]# yarn rmadmin -getServiceState rm2
  2. standby
  3. [root@node1 hadoop]# yarn rmadmin -getServiceState rm1
  4. active

尝试在node1上停止 resourcemanager 测试rm2是否自动切换为active

  1. [root@node1 hadoop]# yarn-daemon.sh stop resourcemanager
  2. stopping resourcemanager
  3. [root@node1 hadoop]# yarn rmadmin -getServiceState rm2
  4. active


声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/繁依Fanyi0/article/detail/394513
推荐阅读
相关标签
  

闽ICP备14008679号