赞
踩
当数据已经存在hdfs上,并且不能随意移动这个数据,这个数据也不能被修改想使用这个数据的时候,只能指定location,建表的时候也可以使用location
(1)创建数据库,通过location,指定在hdfs的路径。
这样数据库存储位置就是'/locate',而非默认的'/user/hive/warehouse'
create database if not exists db01_loc LOCATION '/locate';
创建测试表,查看路径
- create table db01_loc.tb01(
- name string
- )
- row format delimited fields terminated by'\t';
(2)创建表,通过location,指定在hdfs的路径
- create table db01_loc.tb01(
- name string
- )
- row format delimited fields terminated by'\t'
- location '/tb01';
(3)注意:
这个字段的适用场景是:数据已经存在HDFS上不能移动位置了,那么就通过这个字段让表可以直接读到这份数据。另外,要注意建表的时候,应该让表变成外部表。
drop database db01_loc;
drop database db01_loc CASCADE;
(1)新建测试数据
- create table stu_info(
- num int,
- name string
- )
- row format delimited fields terminated by'\t';
-
- load data local inpath '/opt/datas/student.txt' into table stu_info;
(2)只是清空表里面的数据
TRUNCATE TABLE stu_info;
(3)删除了所有的表信息(元数据信息)
drop table if exists stu_info;
(4)重复加载数据的操作:
其实就是上传到hdfs多份数据,然后同名的数据文件会被重命名
load data local inpath '/opt/datas/student.txt' into table stu_info;
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。