当前位置:   article > 正文

两种方法把数据导入到Hive_hive从hdfs导入文件入表

hive从hdfs导入文件入表
一,在Hive中,我们可以本地数据上传到hive,也可以本地数据上传到HDFS,然后再从HDFS中加载到Hive表中。
了解一下hive的导入数据的方法语句
方法一:使用 LOAD DATA INPATH 语句
  1. 创建Hive表:首先,创建一个Hive表,表的结构应该与你要导入的数据的结构相匹配。你可以使用类似以下的SQL语句创建表:

    CREATE TABLE my_table (
        column1 datatype1,
        column2 datatype2,
        ...
    )
    
    • 1
    • 2
    • 3
    • 4
    • 5
  2. 加载数据:使用LOAD DATA INPATH语句将HDFS上的数据加载到Hive表中。例如:

    LOAD DATA INPATH '/path/to/hdfs/file' INTO TABLE my_table;
    
    • 1

    请替换/path/to/hdfs/file为你要导入的HDFS文件的路径。

方法二:使用 INSERT INTO TABLE 语句

  1. 创建Hive表:同样,首先创建一个Hive表,表的结构应该与你要导入的数据的结构相匹配。

  2. 使用 INSERT INTO TABLE 语句:如果你想保留原始数据,并将其复制到Hive表中,可以使用INSERT INTO TABLE语句。例如:

    INSERT INTO TABLE my_table SELECT * FROM my_temp_table;
    
    • 1

    在这个例子中,my_temp_table是一个临时表,其中包含了HDFS上的数据。你可以在SELECT语句中添加适当的过滤条件、转换操作等。

要确保你的Hive表的结构与你要导入的数据的结构相匹配,以及数据文件的格式正确。成功导入数据后,你就可以在Hive中对数据进行查询和分析了。

二,举例子

假设你有一个名为sales_data.csv的CSV文件,它位于你的本地计算机的/home/user/data目录中,你希望将其导入到 ive中的sales_table表中。

首先,确保在Hive中创建了一个适当的表来存储这些数据。假设你已经创建了一个名为sales_table的表,其结构与sales_data.csv中的数据字段对应。你可以使用类似以下的SQL语句创建这个表:

CREATE TABLE sales_table (
    transaction_id INT,
    product_id INT,
    amount DOUBLE,
    transaction_date STRING
)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ','
STORED AS TEXTFILE;
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9

然后,你可以按照以下步骤操作:
直接将本地文件上传到hive

LOAD DATA INPATH 'file://home/user/data/sales_data.csv' INTO TABLE sales_table;
  • 1
  1. 将文件上传到HDFS:使用hadoop fs -put或者hdfs dfs -put命令将本地文件上传到HDFS。例如:
hadoop fs -put /home/user/data/sales_data.csv /user/hive/data
  • 1
  1. 在Hive中加载数据:使用LOAD DATA INPATH语句将数据加载到Hive表中。例如:
LOAD DATA INPATH '/user/hive/data/sales_data.csv' INTO TABLE sales_table;
  • 1

这样,sales_data.csv文件中的数据就被成功加载到了Hive表sales_table中。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小惠珠哦/article/detail/875095
推荐阅读
相关标签
  

闽ICP备14008679号