inceptor手册_inceptor数据库

作者：你好赵伟 | 2024-07-30 15:10:31

踩

inceptor数据库

inceptor手册

inceptor基础
- 对象

inceptor基础

对象

数据库，表，视图，函数；对象的元数据保存在inceptor metastore，数据库对象内的数据在内存或SSD中（Holodesk表）
HDFS（text表/orc表/csv表）

数据库

数据库是存放一组表的目录
可以使用beeline -u “jdbc:hive2://<server_ip/hostname>:10000/"指定数据库
每一个数据库都是hdfs上的目录，路径为hdfs://<nameservice(hdfs的nameservice名称)>/<id（inceptor的服务名）/user/hive/warehouse/<database_name>.db

表

行和列来组织存储的数据
根据inceptor的所有权，分为外表和托管表
根据表的存储格式，分为text表，orc表，csv表和holddesk表
根据是否分区，分为分区表和非分区表
根据是否分桶，分为分桶表和非分桶表

托管表

create table 默认创建托管表，inceptor对其有所有权

外表

create external table，外表数据保存在hdfs指定路径，和location<hdfs_path>合用，inceptor对其没有所有权，drop时，仅删除了metastore中的元数据而不删除表中数据，也就是仅仅删除了inceptor对其的操作权利

text表

默认表格式，不支持事务处理，常用于将文本文件中原始数据导入inceptor，两种方式把文本数据导入text表中
1.建外部text表，让该表指向hdfs上的一个目录，inceptor将目录下的文件数据都导入该表
2.建text表后将本地货hdfs的一个文件或一个目录下的数据load

csv表

ORC表

分为orc事务表和非事务表
事务表支持事务处理和更多的增删该语法，如果对表需要进行事务处理，应选择orc事务表
非事务表主要用来做统计分析

holodesk表

存在内存或SSD中，可以进行大批量复杂查询

分区表

建表时使用partition by，按分区键的值放在hdfs下的不同目录下，减少查询时扫描的数据量

分桶表

clustered by…into…buckets.分桶表的数据按分桶键的哈希值放在hdfs的不同目录下，有效减少扫描数量

视图

create view as select,非实物话的，视图没有实际的数据，对视图查询时，建视图的查询语句会再次执行，可以理解为查询的封装
简化查询，对表中的内容的权限控制

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/你好赵伟/article/detail/904237