当前位置:   article > 正文

hive案例:某家二手房数据简单分析_hive项目二手房项目

hive项目二手房项目

数据字典

小区的名称  户型     面积 区域  楼层     朝向 总价 单价 建筑时间

对应数据表

  1. create table tb_sh_price(
  2. name STRING,
  3. house_type STRING,
  4. house_area STRING,
  5. region STRING,
  6. floor_str STRING,
  7. direction STRING,
  8. total_price STRING,
  9. square_price STRING,
  10. build_date STRING
  11. )
  12. ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' 
  13. LINES TERMINATED BY '\n';

导入数据

LOAD DATA LOCAL INPATH '/opt/datas/2nd_house_price.csv' INTO TABLE tb_sh_price; 

需求一:


面积:统计各个房面积 所在房数
50㎡以下 50-70㎡ 70-90㎡ 90-110㎡ 110-140㎡

  1. select
  2. t.area_grop,count(house_area) as total
  3. from
  4. (
  5. select
  6. house_area,
  7. case
  8. when 0< house_area and house_area<=50 then "50平以下"
  9. when 50< house_area and house_area<=70 then "50-70平"
  10. when 70< house_area and house_area<=90 then "70-90平"
  11. when 90< house_area and house_area<=110 then "90-110平"
  12. when 110< house_area and house_area<=140 then "110-140平"
  13. else "140平+"
  14. end as area_grop
  15. from
  16. db_lianjia.tb_sh_price
  17. ) t
  18. group by
  19. t.area_grop;

运行结果

  1. t.area_grop total
  2. 110-1404190
  3. 140+ 3701
  4. 50-705775
  5. 50平以下 4291
  6. 70-905739
  7. 90-1104505

需求二:

楼龄(1992年建)
5年以内 10年以内 15年以内 20年以内
 

  1. select
  2. t.year_grop,count(build_date) as total
  3. from
  4. (
  5. select
  6. tb_sh_price.build_date,
  7. case
  8. when (2019-substring(build_date,0,4)) between 0 and 5 then "5年以内"
  9. when (2019-substring(build_date,0,4)) between 5 and 10 then "10年以内"
  10. when (2019-substring(build_date,0,4)) between 10 and 15 then "15年以内"
  11. when (2019-substring(build_date,0,4)) between 15 and 20 then "20年以内"
  12. else "20年以上"
  13. end as year_grop
  14. from
  15. tb_sh_price
  16. where
  17. length(trim(build_date))>0
  18. ) as t
  19. group by
  20. t.year_grop;

执行结果:

结果保存到新的表中

  1. create table tb_sh_group
  2. ROW FORMAT DELIMITED FIELDS TERMINATED BY ','
  3. STORED AS TEXTFILE
  4. as
  5. select
  6. t.year_grop,count(build_date) as total
  7. from
  8. (
  9. select
  10. tb_sh_price.build_date,
  11. case
  12. when (2019-substring(build_date,0,4)) between 0 and 5 then "5年以内"
  13. when (2019-substring(build_date,0,4)) between 5 and 10 then "10年以内"
  14. when (2019-substring(build_date,0,4)) between 10 and 15 then "15年以内"
  15. when (2019-substring(build_date,0,4)) between 15 and 20 then "20年以内"
  16. else "20年以上"
  17. end as year_grop
  18. from
  19. tb_sh_price
  20. where
  21. length(trim(build_date))>0
  22. ) as t
  23. group by
  24. t.year_grop;

部分数据

  1. 梅园六街坊,20厅,47.72,浦东,低区/6层,朝南,500,104777,1992年建
  2. 碧云新天地(一期),32厅,108.93,浦东,低区/6层,朝南,735,67474,2002年建
  3. 博山小区,11厅,43.79,浦东,中区/6层,朝南,260,59374,1988年建
  4. 金桥新村四街坊(博兴路986弄),11厅,41.66,浦东,中区/6层,朝南北,280,67210,1997年建
  5. 博山小区,10厅,39.77,浦东,高区/6层,朝南,235,59089,1987年建
  6. 潍坊三村,10厅,34.84,浦东,中区/5层,,260,74626,1983年建
  7. 伟莱家园,22厅,100.15,浦东,中区/6层,朝南北,515,51422,2002年建
  8. 世茂滨江花园,32厅,260.39,浦东,中区/51层,朝西,2200,84488,
  9. 羽北小区,22厅,69.88,浦东,低区/6层,朝南,560,80137,1994年建
  10. 证大家园(公寓),32厅,122.75,浦东,低区/11层,朝南北,785,63951,2002年建
  11. 上南十村,11厅,40.17,浦东,低区/6层,朝南,240,59746,1992年建
  12. 鹏欣家园,11厅,59.42,浦东,中区/6层,朝南,410,69000,1998年建
  13. 香楠小区,22厅,80.34,浦东,高区/6层,,420,52277,
  14. 恒大华城新华苑,21厅,68.9,浦东,高区/6层,朝南北,460,66763,1997年建
  15. 金橘新苑,11厅,61.65,浦东,低区/18层,朝南,370,60016,2006年建
  16. 陆家嘴花园(一期),32厅,156.45,浦东,中区/11层,朝南北,1400,89485,1999年建
  17. 齐七小区,21厅,67.49,浦东,低区/6层,朝南,415,61490,1997年建
  18. 碧云新天地(一期),32厅,129.82,浦东,中区/6层,朝南北,910,70097,2002年建
  19. 芳华路713弄,21厅,65.55,浦东,高区/6层,朝南北,365,55682,1995年建
  20. 环球翡翠湾花园(公寓),32厅,118.86,浦东,中区/18层,朝南北,720,60575,2006年建
  21. 香楠小区,22厅,85.83,浦东,高区/6层,朝南北,440,51264,
  22. 连波路228弄,31厅,72.85,浦东,低区/6层,朝南,430,59025,1996年建

 

声明:本文内容由网友自发贡献,转载请注明出处:【wpsshop】
推荐阅读
相关标签
  

闽ICP备14008679号