当前位置:   article > 正文

Hive数据分析案例——汽车销售数据分析

hive数据分析案例

使用HiveQL实现来实现,本数据为上牌汽车的销售数据,分为乘用车辆和商用车辆。数据包含销售相关数据与汽车具体参数。数据项包括:时间、销售地点、邮政编码、车辆类型、车辆型号、制造厂商名称、排量、油耗、功率、发动机型号、燃料种类、车外廓长宽高、轴距、前后车轮、轮胎规格、轮胎数、载客数、所有权、购买人相关信息等。

3.1创建数据库works。

3.2创建外部表

(1)在hdfs上创建一个空目录work_car;

 

(2)在hive中刚刚建立的数据库works下创建表CarData。

3.3导入数据

3.4查询前10条数据

 

4 需求分析(使结果前十用HiveQL实现):

4.1汽车行业市场分析:

1统计乘用车辆和商用车辆的数量(即非营运和营运车辆)

 

2统计山西省2013年每个月的汽车销售数量

4.2 用户数据市场分析:

1 统计买车的男女比例

 

4.3 不同车型销售统计分析:

1统计不同类型车在每年的总销售量

 

2 统计各品牌汽车销售量,按销售量倒序排序

 

3按所有权和类型分组统计销量

4.统计不同排量的车的数量(排量分为3级 小排量:1000以下,中排量:1000-3000,大排量3000及以上)

 

5 针对某一品牌的竞争分析:

1 统计五菱每一个月的销售量

 

6针对各市销售分析:

1.统计各市销售量,按销量倒序排序

 

 

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/很楠不爱3/article/detail/508424
推荐阅读
相关标签
  

闽ICP备14008679号