赞
踩
Hive对数据的基本操作
一:查询数据
查询表中的所有数据:
hive> select * from tableName;
查询表中特定列数据
hive> select field1 from tableName;
查询表中特定几列的数据
hive> select field1,fields2,... from tableName;
查询表中特定字的段特定值的所有数据
hive> select * from tableName where field = X;
查询表中特定字段特定值的特定字段的数据
hive> select field1,field2,... from tableName where field = X;
查询表中某些特定字的段特定值的所有数据的并集
hive> select * from tableName where field1 = X and field2 = Y;
查询表中某些特定字段的特定值的所有数据的交集
hive> select * from tableName where field1 = X or field2 = Y;
查询表中某些特定字段的特定区间的所有数据
hive> select * from tableName where field1 between X and Y;
查询表中不在某些特定字段的特定区间的所有数据
hive> select * from tableName where field1 not between X and Y;
二:插入数据
插入数据时,Hive会将hql语句转化为MapReduce程序并执行,所以插入数据时,在数据量小时会比较慢,对于数据量大时,比较占优势。
插入一条数据
hive> insert into tableName values ('field1's data','field2's data',...);
从Linux系统本地文件导入数据(local data path是本地数据的存放路径)
注:文件中数据的存放格式要与创建表的时候一样,下同
hive> load data local inpath 'local data path' into table tableName;
从HDFS中导入数据(HDFS data path是HDFS中数据的存放路径)
hive> load data inpath 'HDFS data path' into table tableName;
从其他表中导入数据到本表;
hive> insert into tableName2 select * from tableName1;
三:删除数据
清空表中所有数据
hive> truncate table tableName;
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。