赞
踩
Hive中的分区就是分目录,把一个大的数据集根据业务需要分割成小的数据集。分区表实际上对应一个HDFS文件系统上的文件夹,该文件夹下是该分区的数据文件。
HIVE的分区通过在创建表时启用partition by实现,具体分区的标识是插入内容时指定的。当要查询某一分区的内容时可以采用where语句,通过WHERE子句中的表达式选择查询所需要的指定的分区,这样的查询效率会提高很多。
示例:
二级分区指是2个分区字段
示例:
第一步:创建二级分区表:
第二步:导入数据
第三步:查询数据
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。