当前位置:   article > 正文

Hive默认分隔符介绍

Hive默认分隔符介绍

Hive分隔符

Hive建表时,默认使用的分隔符时候一个特殊的字符,查看表决结构时候是一个’\001’
这不是真正的’\001’,其实是使用八进制编码\001表示,以下为该分隔符使用和编辑的方法

分隔符使用

  1. 1 linux/Mac vi/vim 进入文本编辑
  2. \001 用ctrl+v然后再ctrl+a
  3. \002 用ctrl+v然后再ctrl+b
  4. 2 Java实现
  5. \001
  6. byte[] bytes = new byte[] {1}; String splitString=new String(bytes ,"GBK"); 或者 String splitString = ""+((char) ((int) 1));
  7. \002 用ctrl+v然后再ctrl+b
  8. \002
  9. byte[] bytes = new byte[] {2}; String splitString=new String(bytes ,"GBK"); 或者 String splitString = ""+((char) ((int) 2));

分隔符优点

1 保证数据完整性,在数据抽取存储中通过该分隔符进行分割,非常有效组织了和数据内容冲突的情况。ETL清洗中最为明显
2 很多导入导出工具,不支持多字符分隔符情况单字符满足不了数据切分时
##该分隔符缺点
1 作为key时候shell中不好进行拼接查询,比如hbase.redis等
2 临时操作时不好进行展示,对不知道该分隔符的人会认为没有进行切分。
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/2023面试高手/article/detail/590023
推荐阅读
相关标签
  

闽ICP备14008679号