当前位置:   article > 正文

大数据Hive高频面试题(附答案)_hivesql经典大数据面试题

hivesql经典大数据面试题

一、Hive面试题

1、hive内部表和外部表的区别

未被external修饰的是内部表,被external修饰的为外部表。

区别:

内部表数据由Hive自身管理,外部表数据由HDFS管理;
内部表数据存储的位置是hive.metastore.warehouse.dir(默认:/user/hive/warehouse),    外部表数据的存储位置由自己制定(如果没有LOCATION,Hive将在HDFS上       的/user/hive/warehouse文件夹下以外部表的表名创建一个文件夹,并将属于这个表的数据存    放在这里);
删除内部表会直接删除元数据(metadata)及存储数据;删除外部表仅仅会删除元数据,HDFS上的文件并不会被删除。
 

2、Hive有索引吗

Hive支持索引(3.0版本之前),但是Hive的索引与关系型数据库中的索引并不相同。并且    Hive索引提供的功能很有限,效率也并不高,因此Hive索引很少使用。

索引适用的场景:

适用于不更新的静态字段。以免总是重建索引数据。每次建立、更新数据后,都要重建索    引以构建索引表。

3、运维如何对hive进行调度

将hive的sql定义在脚本当中;
使用azkaban或者oozie进行任务的调度;
监控任务调度页面。

4、ORC、Parquet等列式存储的优点

ORC:ORC文件是自描述的,它的元数据使

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/秋刀鱼在做梦/article/detail/745894
推荐阅读
相关标签
  

闽ICP备14008679号