当前位置:   article > 正文

编译适合CDH6.3.2的spark3.3.2_cdh6.3.2集成spark3.3.2

cdh6.3.2集成spark3.3.2

 版本对应

Spark版本3以上不再支持scala2.11 

环境:

jdk:1.8.0_181

 maven:3.6.3

 scala2.12.0

 配置环境变量

  1. #jdk
  2. export JAVA_HOME=/usr/java/jdk1.8.0_181-amd64
  3. export JRE_HOME=${JAVA_HOME}/jre
  4. export CLASSPATH=.:${JAVA_HOME}/lib:${JRE_HOME}/lib:$CLASSPATH
  5. export JAVA_PATH=${JAVA_HOME}/bin:${JRE_HOME}/bin
  6. #maven
  7. export MAVEN_HOME=/usr/local/apache-maven-3.6.3
  8. export MAVEN_HOME
  9. export PATH=$PATH:$MAVEN_HOME/bin
  10. #scala
  11. export SCALA_HOME=/usr/local/scala-2.11.12
  12. export PATH=$PATH:$SCALA_HOME/bin

下载spark源码包

saprk源码

 

修改pom.xml文件

  1. 增加cloudera的mvn镜像
  2. 303
  3.    <repository>
  4.        <id>cloudera</id>
  5.        <url>https://repository.cloudera.com/artifactory/cloudera-repos/</url>
  6.        <name>Cloudera Repositories</name>
  7.        <snapshots>
  8.          <enabled>true</enabled>
  9.        </snapshots>
  10.      </repository>
  11. 342
  12.    <pluginRepository>
  13.      <id>cloudera</id>
  14.      <name>Cloudera Repositories</name>
  15.      <url>https://repository.cloudera.com/artifactory/cloudera-repos/</url>
  16.    </pluginRepository>
  17. 修改hadoop版本
  18. 123
  19. <hadoop.version>3.0.0-cdh6.3.2</hadoop.version>

修改编辑脚本中的mvn仓库指向

  1. vi /opt/spark-3.2.2/dev/make-distribution.sh
  2. MVN='/usr/local/apache-maven-3.6.3/bin/mvn'

在脚本中,根据自己的资源确定内存大小,防止内存溢出

export MAVEN_OPTS="${MAVEN_OPTS:--Xmx1g -XX:ReservedCodeCacheSize=512m

编译命令

  1. ./dev/make-distribution.sh \
  2. --name 3.0.0-cdh6.3.2 --tgz  -Pyarn -Phadoop-3.0 \
  3. -Phive -Phive-thriftserver -Dhadoop.version=3.0.0-cdh6.3.2 -X

编译完成

 

报错

jar包没有,下载失败。。。

修改pom

  1. 1
  2. <parent>
  3.    <groupId>org.apache</groupId>
  4.    <artifactId>apache</artifactId>
  5.    <version>18</version>
  6.    <relativePath></relativePath>
  7.   </parent>
  8. org.apache增加
  9. <relativePath></relativePath>
  10. 2
  11. <scalaVersion>${scala.version}</scalaVersion>
  12. <checkMultipleScalaVersions>true</checkMultipleScalaVersions>
  13. <failOnMultipleScalaVersions>true</failOnMultipleScalaVersions>
  14. <recompileMode>incremental</recompileMode>
  15. <useZincServer>false</useZincServer>
  16. scala.version增加
  17. <useZincServer>false</useZincServer>
  18. 3
  19. 修改net.alchim31.maven版本(全部)为3.2.2
  20. <dependency>
  21. <groupId>net.alchim31.maven</groupId>
  22. <artifactId>scala-maven-plugin</artifactId>
  23. <version>3.2.2</version>

使用mvn打包命令先测试(把一些jar包下载下来)

build/mvn -Pyarn -Phadoop-3.0.0 -Dhadoop.version=3.0.0-cdh6.3.2 -DskipTests clean package

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/花生_TL007/article/detail/625454
推荐阅读
  

闽ICP备14008679号