当前位置:   article > 正文

hive创建table时指定分隔符

hive创建table时指定分隔符

由于hive由java编写,所以row format delimited fields terminated by 后也可以使用java的方式输入特殊字符,比如用java的转义字符——反斜杠()+0+八进制数字可以代表任意ASCII码,或者用\u + 四位数字可以代表任意Unicode字符。

比如hive创建表格的默认分隔符为SOH字符,ASCII码中的序号为1,所以可以用’\001’表示。
数据迁移到hive目录下时,由于hive默认的分隔符是/u0001,为了平滑迁移,需要在创建表格时指定数据的分割符号,语法如下:

create table test(uid string,name string)row format delimited fields terminated by ‘/t’;

一个比较简单的方法是直接创建 external table,语法如下:

create table test(uid string,name string) row format delimited fields terminated by ‘/t’ location ‘hdfs’;

通过这种方式,避免数据的移动带来时间损耗,提高运行的效率。

hive指定数据切分格式–row format

创建表时需要指定数据切分格式,会用到ROW FORMAT关键字。

下面是java集合框架图,存入hive的数据就是集合中的某一种

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小小林熬夜学编程/article/detail/590040
推荐阅读
相关标签
  

闽ICP备14008679号