当前位置:   article > 正文

CDH | Spark升级_cdh spark2和3 区别 cdh spark升级

cdh spark2和3 区别 cdh spark升级

参考文章:CDH| Spark升级

目录

升级之Spark升级

 升级过程

1 离线包下载

2 离线包上传

 页面操作

命令行查看命令


升级之Spark升级

在CDH5.12.1集群中,默认安装的Spark是1.6版本,这里需要将其升级为Spark2.1版本。经查阅官方文档,发现Spark1.6和2.x是可以并行安装的,也就是说可以不用删除默认的1.6版本,可以直接安装2.x版本,它们各自用的端口也是不一样的。

Cloudera发布Apache Spark 2概述(可以在这里面找到安装方法和parcel包的仓库)

cloudera的官网可以下载相关的parcel 的离线安装包:

https://www.cloudera.com/documentation/spark2/latest/topics/spark2_installing.html

Cloudera Manager及5.12.0版本的介绍:

https://www.cloudera.com/documentation/enterprise/latest/topics/cm_ig_parcels.html#cmug_topic_7_11_5__section

 升级过程

1. 离线包下载

1)所需软件:http://archive.cloudera.com/spark2/csd/

   

2)Parcels 包的下载地址:http://archive.cloudera.com/spark2/parcels/2.1.0.cloudera1/

2. 离线包上传

1)上传文件SPARK2_ON_YARN-2.1.0.cloudera1.jar到/opt/cloudera/csd/下面

2)上传文件SPARK2-2.1.0.cloudera1-1.cdh5.7.0.p0.120904-el6.parcel和SPARK2-2.1.0.cloudera1-1.cdh5.7.0.p0.120904-el6.parcel.sha1 到/opt/cloudera/parcel-repo/

3)将SPARK2-2.1.0.cloudera1-1.cdh5.7.0.p0.120904-el6.parcel.sha1重命名为SPARK2-2.1.0.cloudera1-1.cdh5.7.0.p0.120904-el6.parcel.sha

[root@hadoop101 parcel-repo]# mv /opt/cloudera/parcel-repo/SPARK2-2.1.0.cloudera1-1.cdh5.7.0.p0.120904-el6.parcel.sha1 /opt/cloudera/parcel-repo/SPARK2-2.1.0.cloudera1-1.cdh5.7.0.p0.120904-el6.parcel.sha
  1. [kris@hadoop101 parcel-repo]$ ll
  2. total 2673860
  3. -rw-r--r-- 1 kris kris 364984320 Jul 2 2019 APACHE_PHOENIX-4.14.0-cdh5.14.2.p0.3-el7.parcel
  4. -rw-r--r-- 1 kris kris 41 Jul 2 2019 APACHE_PHOENIX-4.14.0-cdh5.14.2.p0.3-el7.parcel.sha
  5. -rw-r----- 1 root root 14114 Jul 2 2019 APACHE_PHOENIX-4.14.0-cdh5.14.2.p0.3-el7.parcel.torrent
  6. -rw-r--r-- 1 cloudera-scm cloudera-scm 2108071134 Jun 27 2019 CDH-5.14.2-1.cdh5.14.2.p0.3-el7.parcel
  7. -rw-r--r-- 1 cloudera-scm cloudera-scm 41 Jun 27 2019 CDH-5.14.2-1.cdh5.14.2.p0.3-el7.parcel.sha
  8. -rw-r----- 1 cloudera-scm cloudera-scm 80586 Jun 27 2019 CDH-5.14.2-1.cdh5.14.2.p0.3-el7.parcel.torrent
  9. -rw-r--r-- 1 cloudera-scm cloudera-scm 72851219 Jun 29 2019 KAFKA-3.1.1-1.3.1.1.p0.2-el7.parcel
  10. -rw-r--r-- 1 cloudera-scm cloudera-scm 41 Jun 29 2019 KAFKA-3.1.1-1.3.1.1.p0.2-el7.parcel.sha
  11. -rw-r----- 1 root root 2940 Jun 29 2019 KAFKA-3.1.1-1.3.1.1.p0.2-el7.parcel.torrent
  12. -rw-r--r-- 1 cloudera-scm cloudera-scm 74062 Jun 27 2019 manifest.json
  13. -rw-r--r-- 1 cloudera-scm cloudera-scm 191904064 Jun 29 2019 SPARK2-2.3.0.cloudera4-1.cdh5.13.3.p0.611179-el7.parcel
  14. -rw-r--r-- 1 cloudera-scm cloudera-scm 41 Oct 5 2018 SPARK2-2.3.0.cloudera4-1.cdh5.13.3.p0.611179-el7.parcel.sha
  15. -rw-r----- 1 cloudera-scm cloudera-scm 7521 Jun 29 2019 SPARK2-2.3.0.cloudera4-1.cdh5.13.3.p0.611179-el7.parcel.torrent
  16. [kris@hadoop101 parcel-repo]$ pwd
  17. /home/kris/apps/usr/webserver/cloudera/parcel-repo
  18. [kris@hadoop101 csd]$ pwd
  19. /home/kris/apps/usr/webserver/cloudera/csd
  20. [kris@hadoop101 csd]$ ll
  21. total 28
  22. -rw-r--r-- 1 cloudera-scm cloudera-scm 5670 Feb 22 2018 KAFKA-1.2.0.jar
  23. -rw-r--r-- 1 cloudera-scm cloudera-scm 19037 Oct 5 2018 SPARK2_ON_YARN-2.3.0.cloudera4.jar
  24. [kris@hadoop101 csd]$ ll
  25. total 28
  26. -rw-r--r-- 1 cloudera-scm cloudera-scm 5670 Feb 22 2018 KAFKA-1.2.0.jar
  27. -rw-r--r-- 1 cloudera-scm cloudera-scm 19037 Oct 5 2018 SPARK2_ON_YARN-2.3.0.cloudera4.jar

 3. 页面操作

   更新Parcel

    在cm首页点击Parcel,再点击检查新Parcel

点击分配、点击激活、回到首页点击添加服务

如果没有Spark2,则重启server:

[root@hadoop101 ~]# /opt/module/cm/cm-5.12.1/etc/init.d/cloudera-scm-server restart

选择一组依赖关系

 角色分配、   部署并启动

  1. 注意:这里我报了一个错:客户端配置 (id=12) 已使用 1 退出,而预期值为 0
  2. 1)问题原因:最后找到原因是因为CM安装Spark不会去环境变量去找Java,需要将Java路径添加到CM配置文件
  3. 2)解决方法1(需要重启cdh):
  4. [root@hadoop101 java]# vim /opt/module/cm/cm-5.12.1/lib64/cmf/service/client/deploy-cc.sh
  5. 在文件最后加上
  6. JAVA_HOME= /opt/module/jdk1.8.0_104
  7. export JAVA_HOME= /opt/module/jdk1.8.0_104
  8. 3)解决方法2(无需重启cdh):
  9. 查看/opt/module/cm/cm-5.12.1/lib64/cmf/service/common/cloudera-config.sh
  10. 找到java8的home目录,会发现cdh不会使用系统默认的JAVA_HOME环境变量,而是依照bigtop进行管理,
  11. 因此我们需要在指定的/usr/java/default目录下安装jdk。
  12. 当然我们已经在/opt/module/jdk1.8.0_104下安装了jdk,因此创建一个连接过去即可
  13. [root@hadoop101 ~]# mkdir /usr/java
  14. [root@hadoop101 ~]# ln -s /opt/module/jdk1.8.0_104/ /usr/java/default
  15. [root@hadoop102 ~]# mkdir /usr/java
  16. [root@hadoop102 ~]# ln -s /opt/module/jdk1.8.0_104/ /usr/java/default
  17. [root@hadoop103 ~]# mkdir /usr/java
  18. [root@hadoop103 ~]# ln -s /opt/module/jdk1.8.0_104/ /usr/java/default
  19. 3)解决方法3(需要重启cdh):
  20. 找到hadoop101、hadoop102、hadoop103三台机器的配置,配置java主目录

 

 

命令行查看命令

  1. [hdfs@hadoop101 ~]$ spa
  2. spark2-shell spark2-submit spark-shell spark-submit spax

 

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/AllinToyou/article/detail/625485
推荐阅读
相关标签
  

闽ICP备14008679号