赞
踩
Hadoop YARN集群是一个通用的资源管理平台,可为各类计算框架提供资源的管理和调度。其核心是通过一个全局的资源管理器来实现分离资源管理与作业调度/监控。Hadoop YARN具有更高的可靠性,通过结合Zookeeper技术,可以实现分布式计算集群的高可用。同时,Hadoop YARN支持动态的资源调度,当没有新的分析作业时,会自动释放占用的计算资源,更节省计算资源。
本操作说明将带领您实现在iServer中集成Hadoop YARN集群并进行分布式分析。本操作说明包括以下两部分:
第一部分为搭建开启认证的YARN集群和开启认证的Hadoop集群,文中将为您介绍如何启动YARN集群和Hadoop集群,以及kerberos配置
第二部分为iServer使用YARN集群和Hadoop集群前所需配置。包括在iServer所在的服务器中配置Kerberos客户端,启动iServer内置的Spark集群,配置UGO等。
本说明以虚拟机centos7系统为例,您需要准备以下安装包:
Hadoop安装包:Hadoop-2.7.3.tar.gz,下载后的存放路径:/home/iserver
JDK安装包:jdk-8u131-linux-x64.tar.gz:
Jsvc安装包:commons-daemon-1.0.15-src.tar.gz
Kerberos客户端安装包(windows): kfw-4.1-amd64.msi
在Master与各个节点分别创建以下用户组和用户,具体步骤如下:
为各节点间root、HDFS、YARN用户配置免密登录,具体步骤如下:
解压jdk-8u131-linux-x64.tar.gz,并将其路径设置到环境变量中。
安装jsvc的步骤如下:
进入{HADOOP_HOME}/etc/hadoop目录,进行如下配置。
启动开启Kerberos认证的YARN 集群和开启Kerberos认证的Hadoop集群的步骤如下。
在Master节点下的HADOOP安装目录下执行以下命令:
通过以下操作来验证YARN 集群和Hadoop集群是否成功启动:
YARN 集群:访问Master节点IP:8088
Hadoop集群: 访问Master节点IP:50070
安装时,请确认客户端所在机器时间与服务器系统时间差不能超过5分钟。
iServer安装在Windows系统上时,需修改C:\ProgramData\MIT\Kerberos5\krb5.ini文件,所设定Kerberos信息必须与Kerberos服务配置(krb5.conf)相同。具体内容如下所示:
[libdefaults]
default_realm = SUPERMAP.COM
[realms]
SUPERMAP.COM = {
kdc = 192.168.112.162
admin_server = 192.168.112.162
}
iServer服务在Linux 上,则需修改etc/krb5.conf。内容与Kerberos服务配置(krb5.conf)相同。
在【iServer安装路径】\support\ spark下的spark-default.conf中增加如下参数:
spark.yarn.am.memory 4g
此参数代表application master的内存大小,如果不设置,默认是512M。为了确保iServer分布式分析服务能够正常使用,修改为4G。用户可以根据自己的机器的内存合理分配。
使用Windows版本的iServer,需要另外增加如下配置:
spark.hadoop.yarn.resourcemanager.hostname hostname
更多的配置参见:http://spark.apache.org/docs/latest/running-on-yarn.html
在YARN集群的各个子节点下需要配置UGO,910及其以后版本的组件支持以下两种方式进行配置:
在iServer设置前需进行以下操作:
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。