当前位置:   article > 正文

Hive-表设计优化

Hive-表设计优化

Hive-表设计优化

1.Hive查询基本原理

  • Hive的设计思想是通过元数据解析描述将HDFS上的文件映射成表。

  • 基本的查询原理是当用户通过HQL语句对Hive中的表进行复杂数据处理和计算时,默认将其转换为分布式计算MapReduce程序对HDFS中的数据进行读取处理的过程。

在这里插入图片描述

  • 当执行查询计划时,Hive会使用表的最后一级目录作为底层处理数据的输入。

在这里插入图片描述

在这里插入图片描述

2.分区表的设计与使用

  • 普通表结构问题:
    在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

3.分桶表的设计与使用

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

4.索引的设计与使用

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:【wpsshop博客】
推荐阅读
相关标签
  

闽ICP备14008679号