当前位置:   article > 正文

Hive两小案例_hive综合应用案例用户学历查询

hive综合应用案例用户学历查询

Hive案例

第1题

我们有如下的用户访问数据

userId visitDate visitCount
u01 2017/1/21 5
u02 2017/1/23 6
u03 2017/1/22 8
u04 2017/1/20 3
u01 2017/1/23 6
u01 2017/2/21 8
u02 2017/1/23 6
u01 2017/2/22 4

要求使用SQL统计出每个用户的累积访问次数,如下表所示:

用户id 月份 小计 累积
u01 2017-01 11 11
u01 2017-02 12 23
u02 2017-01 12 12
u03 2017-01 8 8
u04 2017-01 3 3

数据:

u01 2017/1/21 5

u02 2017/1/23 6

u03 2017/1/22 8

u04 2017/1/20 3

u01 2017/1/23 6

u01 2017/2/21 8

u02 2017/1/23 6

u01 2017/2/22 4

  1. 创建table,加载数据

    create tbale action(
     userId string,visitDate     string ,visitCount   int 
    )
    row format delimited fields terminated by '\t';
    load data local inpath '/opt/module/datas/viste.txt' into table action;
    
    • 1
    • 2
    • 3
    • 4
    • 5
  2. 分析原表中的数据以及结果输出的表数据,发现visitDate字段需要进行格式转换以及分割,格式转换联想到date_format函数,

    select action.userid ,date_format(regexp_rep(action.visitDate,'/','-'),'yyyy-MM') date_dt,action.visitCount  from action;--t1
    
    • 1
  3. 分析结果表的小计字段,发现其为每个用户的每个月的花费小计,故使用分组,进行sum统计即可

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/我家小花儿/article/detail/686598
推荐阅读
相关标签
  

闽ICP备14008679号