当前位置:   article > 正文

Spark SQL_error transportresponsehandler: 7077 is closed

error transportresponsehandler: 7077 is closed

创建DataFrames 

一、spark-shell版本

1)spark-shell版本
spark中已经创建好了SparkContext和SQLContext对象
2)代码:

spark-shell命令

./spark-shell --master spark://hdp-1:7077 --executor-memory 500m --total-executor-cores 1

//创建了一个数据集,实现了并行化

var seq = Seq(("1","xiaoming",15),("2","xiaohong",20),("3","xiaoben",10))

 加载信息:seq: Seq[(String, String, Int)] = List((1,xiaoming,15), (2,xiaohong,20), (3,xiaoben,10))

var rdd1 =sc.parallelize(seq)

加载信息: rdd1: org.apache.spark.rdd.RDD[(String, String, Int)] = ParallelCollectionRDD[0] at parallelize at <console>:26

将当前的rdd对象转换为DataFrame对象(数据信息和数据结构信息存储到DataFrame)
//_1:string,_2:string,3:int
rdd1.toDF

//在使用toDF进行转换的时候,空参的情况下。默认是+数据 作为列名,数字从1开始逐渐递增

val df = rdd1.toDF("id","name","age")

加载信息:df: org.apache.spark.sql.DataFrame = [id: string, name: string ... 1 more field]


 _1:列名,String当前列的数据类型
//查看数据 show 算子来打印,show是一个action类型 算子

查看数据

df.show

查询结果:

  1. +---+--------+---+
  2. | id| name|age|
  3. +---+--------+---+
  4. | 1|xiaoming| 15|
  5. | 2|xiaohong| 20|
  6. | 3| xiaoben| 10|
  7. +---+--------+---+

DSL 风格语法
1.查询:

1.1查询姓名

df.select("name").show

结果:

  1. +--------+
  2. | name|
  3. +--------+
  4. |xiaoming|
  5. |xiaohong|
  6. | xiaoben|
  7. +--------+

1.2查询姓名和年龄

df.select("name","age").show

结果:

  1. +--------+---+
  2. | name|age|
  3. +--------+---+
  4. |xiaoming| 15|
  5. |xiaohong| 20|
  6. | xiaoben| 10|
  7. +--------+---+

//条件过滤

//参数必须是一个字符串,filter中的表达式也需要时一个字符串

1.3查询年龄>10岁的姓名和年龄

df.select("name","age").filter("age >10").show

结果:

  1. +--------+---+
  2. | name|age|
  3. +--------+---+
  4. |xiaoming| 15|
  5. |xiaohong| 20|
  6. +--------+---+

//2.参数是类名col (“列名”)

df.select("name","age").filter(col("age") >10).show

结果:

  1. +--------+---+
  2. | name|age|
  3. +--------+---+
  4. |xiaoming| 15|
  5. |xiaohong| 20|
  6. +--------+---+

//3.分组统计个数

df.groupBy("age").count().show()

结果:

  1. +---+-----+
  2. |age|count|
  3. +---+-----+
  4. | 20| 1|
  5. | 15| 1|
  6. | 10| 1|
  7. +---+-----+

//4.打印DataFrame结构信息

df.printSchema

结果:

  1. root
  2. |-- id: string (nullable = true)
  3. |-- name: string (nullable = true)
  4. |-- age: integer (nullable = false)

Sql 风格语法:

1.将DataFrame注册成表(临时表),

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/正经夜光杯/article/detail/785642
推荐阅读
相关标签
  

闽ICP备14008679号