当前位置:   article > 正文

大数据面试(一):Hive面试题

hive面试

在这里插入图片描述

面试题01、 请说下Hive和数据库的区别

Hive 和数据库除了拥有类似的查询语言,再无类似之处。
1)数据存储位置
Hive 存储在 HDFS 。数据库将数据保存在块设备或者本地文件系统中。
2)数据更新
Hive中不建议对数据的改写。而数据库中的数据通常是需要经常进行修改的,
3)执行延迟
Hive 执行延迟较高。数据库的执行延迟较低。当然,这个是有条件的,即数据规模较小,当数据规模大到超过数据库的处理能力的时候,Hive的并行计算显然能体现出优势。
4)数据规模
Hive支持很大规模的数据计算;数据库可以支持的数据规模较小。

面试题02、 内部表和外部表

1)内部表又叫管理表:当我们删除一个管理表时,Hive也会删除这个表数据。管理表不适合和其他工具共享数据。
2)外部表:删除该表并不会删除掉原始数据,删除的是表的元数据

详答版:

未被 external 修饰的是内部表(managed table),被 external 修饰的为外部表 (external table)
区别:
内部表数据由 Hive 自身管理,外部表数据由 HDFS 管理;
内部表数据存储的位置是hive.metastore.warehouse.dir(默认:/user/hive/ware

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/知新_RL/article/detail/811428
推荐阅读
相关标签
  

闽ICP备14008679号