赞
踩
环境 centos7 Hadoop2.6.5 hive 1.x
一. 从普通文本加载数据到hive仓库
1.使用 命令hive 进入hive命令行;
2.创建数据库 create database if not exists hivetest;
3.切换数据库 use hivetest;
4. 创建表
create table if not exists student(
id bigint comment ‘studentId’,
name String
)
row format delimited fields terminated by ‘\t’ —每行数据的字段是用tab(\t)来区分
lines terminated by ‘\n’ –每条数据用换行区分
stored as textfile;
4.创建要导入的数据文件
我在/home/data放了一个student文件,文件内容
1 小明
2 小红
3 消息
5.把student文件的数据导入数据到hive
load data local inpath ‘/home/data/student’ into table student; (这是本地加载数据)
实验结果:
还可以加载HDFS上的。先把student文件存储到hdfs上。
[root@localhost data]# hdfs dfs -put ./student /
[root@localhost data]# hdfs dfs -ls /
Found 5 items
drwxr-xr-x - root supergroup 0 2018-06-23 19:05 /hdfsapi
-rw-r–r– 1 root supergroup 34 2018-06-19 23:00 /hello.txt
-rw-r–r– 1 root supergroup 28 2018-07-14 13:30 /student
drwx-wx-wx - root supergroup 0 2018-07-11 21:29 /tmp
drwxr-xr-x - root supergroup 0 2018-07-12 23:36 /user
然后把HDFS的数据导入到hive中
hive> load data inpath ‘/student’ into table student2;
Loading data to table hivetest.student2
OK
Time taken: 1.487 seconds
hive> select * from student2;
OK
1 小明
2 小红
3 消息
Time taken: 0.434 seconds, Fetched: 3 row(s)
hive>
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。