当前位置:   article > 正文

JavaSpark | RDD实战:二次排序_rdd实现二次排序的过程

rdd实现二次排序的过程



1.二次排序

  二次排序。顾名思义,就是先按第一个列进行排序,在此基础上,再按第二个位置排序。

三次排序、四次排序与二次排序原理一致

/*
* SecondSort:第一个数据比完,再比较第二个数据
* 想要通过算子进行排序,在这边只能使用sortByKey,但是数据本身不是一个普通的对象
* 所以,要自定义key对象,引入Serializable, Comparable接口,重写compareTo方法,实现比较逻辑
* */
  • 1
  • 2
  • 3
  • 4
  • 5

  案例数据格式如下:
在这里插入图片描述

2.二次排序实战

SecondSortKey.java:

package com.shsxt.java;

import java.io.Serializable;

public class SecondSortKey implements Serializable, Comparable<SecondSortKey> {
   

    //成员属性
    private int first;
    private int second;

    //get与set方法
    public int getFirst() {
   
        return first;
    }
    public void setFirst(int first) {
   
        this.first = first;
    }
    public int getSecond() {
   
        return second;
    }
    public void setSecond
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/2023面试高手/article/detail/670641
推荐阅读
相关标签
  

闽ICP备14008679号