当前位置:   article > 正文

Hive默认分割符

hive默认分隔符

1、Hive默认的分隔符

Hive的表数据,不管导出到HDFS还是本地文件系统,如果用户在导出时没有指定分割符,那么Hive表的数据在写入文件时,会使用默认的分隔符作为列分隔符,该默认的分割是“CTR+A”,ASCII码排第二位的字符,是不可见字符,二进制表示:'\u0001'。

2、显示Hive默认的分隔符

有些文本编辑器无法显示不可见字符,会直接用一个小方框代替,乍一看很像是乱码,其实不是,比如下图,在Linux上使用cat查看Hive表导出后的数据,默认的分隔符是看不出来的:

如果要显示分隔符,可以在导出的表数据的时候,指定可以显示的分隔符,比如‘,’,‘@’等。

导出Hive表数据时,如何指定分隔符,可以参考FusionInsight产品CPI文档,或者上Hive的官网查wiki。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/笔触狂放9/article/detail/389878
推荐阅读
相关标签
  

闽ICP备14008679号