赞
踩
本实验对应第 8 章的内容。
(1)理解 Hive 作为数据仓库在 Hadoop 体系结构中的角色。
(2)熟练使用常用的 HiveQL。
操作系统 | Linux |
---|---|
Hadoop 版本 | 3.1.3 |
Hive 版本 | 3.1.2 |
JDK 版本 | 1.8 |
由《Hive 编程指南》(O’Reilly 系列,人民邮电出版社)提供,下载地址:
https://raw.githubusercontent.com/oreillymedia/programming_hive/master/prog-hive-1sted-data.zip
备用下载地址:
https://www.cocobolo.top/FileServer/prog-hive-1st-ed-data.zip
解压后可以得到本实验所需的 stocks.csv 和 dividends.csv 两个文件。
(1)创建一个内部表 stocks,字段分隔符为英文逗号
create table if not exists stocks
(
`exchange` string,
`symbol` string,
`ymd` string,
`price_open` float,
`price_high` float,
`price_low` float,
`price_close` float,
`volume` int,
`price_adj_close` float
)
row format delimited fields terminated by ',';
(2)创建一个外部分区表 dividends(分区字段为 exchange 和 symbol),字段分隔符为英文逗号,表结构如表 A-7 所示。
create external table if not exists dividends
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。