当前位置:   article > 正文

大数据Spark(二十八):SparkSQL案例三电影评分数据分析_spark 每年评分前三的电影,显示年份、电影名、评分。按年份降序、评分降序排列

spark 每年评分前三的电影,显示年份、电影名、评分。按年份降序、评分降序排列

 文章目录

案例三:电影评分数据分析

代码实现

Shuffle分区数


案例三:电影评分数据分析

     使用电影评分数据进行数据分析,分别使用DSL编程和SQL编程,熟悉数据处理函数及SQL使用,业务需求说明:

对电影评分数据进行统计分析,获取Top10电影(电影评分平均值最高,并且每个电影被评分的次数大于200)

数据格式如下,每行数据各个字段之间使用双冒号分开:

数据处理分析步骤如下:

  1. 第一步、读取电影评分数据,从本地文件系统读取
  2.  第二步、转换数据,指定Schema信息,封装到DataFrame
  3.  第三步、基于SQL方式分析
  4.  第四步、基于DSL方式分析

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/知新_RL/article/detail/945521
推荐阅读
相关标签
  

闽ICP备14008679号