当前位置:   article > 正文

Hive基础使用

Hive基础使用

Hive启动方式:

1.CLI界面:使用hive命令或hive --service cli即可进入hive cli。

2.远程服务:使用hive --service hiveserver2 &方式启动远程服务,这样就可以使用jdbc或thrift客户端调用hive数据仓库


Hive数据类型

我们可以在官网的hive wiki中查看到所有的数据类型。Hive wiki

Hive数据类型大体可以分成两类,基础数据类型和复杂数据类型。这里主要讨论常用类型。

1.基础数据类型。

  1)数字类型

  1. 整型 tinyint/smallint/int/integer/bigint
  2. 浮点型 float/double/decimal

  2)日期类型

timestamp/date/interval

  3)字符串类型

string/varchar/char

  4)其他类型

boolean/binary

2.复杂数据类型。

  1. arrays: ARRAY<data_type> (Note: negative values and non-constant expressions are allowed as of Hive 0.14.)
  2. maps: MAP<primitive_type, data_type> (Note: negative values and non-constant expressions are allowed as of Hive 0.14.)
  3. structs: STRUCT<col_name : data_type [COMMENT col_comment], ...>
  4. union: UNIONTYPE<data_type, data_type, ...> (Note: Only available starting with Hive 0.7.0.)

Hive表

Hive中的表可以分为内部表,外部表,分区表和桶表。


内部表:

表中的数据受表定义影响,表删除后表中数据随之删除。使用一般的语句创建的就是内部表,例如create table test (id int);


外部表:

数据不受表定义影响,表删除后数据仍在。

外部表的数据指向已经在HDFS中存在的数据。它和内部表在元数据的组织上是相同的,而实际数据的存储则有较大的差异。外部表只有一个过程,加载数据和创建表同时完成,并不会移动到数据库目录中,和外部数据建立一个连接。当删除一个外部表时,仅删除连接。有点类似视图。

语法:

  1. create external table external_test (
  2. id int,
  3. name string
  4. )
  5. row format delimited fields terminated by ','
  6. location '/input';
hadoop的/input/input.txt下文件
  1. 1,Tom
  2. 2,Mary

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/正经夜光杯/article/detail/979062
推荐阅读
相关标签
  

闽ICP备14008679号