赞
踩
由于hive由java编写,所以row format delimited fields terminated by 后也可以使用java的方式输入特殊字符,比如用java的转义字符——反斜杠()+0+八进制数字可以代表任意ASCII码,或者用\u + 四位数字可以代表任意Unicode字符。
比如hive创建表格的默认分隔符为SOH字符,ASCII码中的序号为1,所以可以用’\001’表示。
数据迁移到hive目录下时,由于hive默认的分隔符是/u0001,为了平滑迁移,需要在创建表格时指定数据的分割符号,语法如下:
create table test(uid string,name string)row format delimited fields terminated by ‘/t’;
一个比较简单的方法是直接创建 external table,语法如下:
create table test(uid string,name string) row format delimited fields terminated by ‘/t’ location ‘hdfs’;
通过这种方式,避免数据的移动带来时间损耗,提高运行的效率。
创建表时需要指定数据切分格式,会用到ROW FORMAT关键字。
下面是java集合框架图,存入hive的数据就是集合中的某一种
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。