赞
踩
使用HiveQL实现来实现,本数据为上牌汽车的销售数据,分为乘用车辆和商用车辆。数据包含销售相关数据与汽车具体参数。数据项包括:时间、销售地点、邮政编码、车辆类型、车辆型号、制造厂商名称、排量、油耗、功率、发动机型号、燃料种类、车外廓长宽高、轴距、前后车轮、轮胎规格、轮胎数、载客数、所有权、购买人相关信息等。
3.1创建数据库works。
3.2创建外部表
(1)在hdfs上创建一个空目录work_car;
(2)在hive中刚刚建立的数据库works下创建表CarData。
3.3导入数据
3.4查询前10条数据
1统计乘用车辆和商用车辆的数量(即非营运和营运车辆)
2统计山西省2013年每个月的汽车销售数量
1 统计买车的男女比例
1统计不同类型车在每年的总销售量
2 统计各品牌汽车销售量,按销售量倒序排序
3按所有权和类型分组统计销量
4.统计不同排量的车的数量(排量分为3级 小排量:1000以下,中排量:1000-3000,大排量3000及以上)
1 统计五菱每一个月的销售量
1.统计各市销售量,按销量倒序排序
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。