当前位置:   article > 正文

04-用户画像+sqoop使用

04-用户画像+sqoop使用

优点

sqoop的作用是实现数据的导入和导出,主要是对数据库和数据仓库之间的操作

只要是支持jdbc连接的数据库都可以使用sqoop操作

添加Sqoop到环境变量中

export SQOOP_HOME=/export/server/sqoop
export PATH=$PATH:$SQOOP_HOME/bin:$SQOOP_HOME/sbin

  • 1
  • 2
  • 3
source /etc/profile
  • 1

在这里插入图片描述

启动数仓服务

./up01.sh start
  • 1

sqoop建表语句

create database itcast charset=utf8;
create table itcast.tb_user(
    id int,
    name varchar(20),
    age int,
    gender varchar(20)
);
insert into itcast.tb_user value(1,'张三',20,'男');
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8

hive数仓中的准备

create database itcast;
  • 1

hive表指令

  • create-hive-table 根据mysql表创建hive表
  • –connect mysql连接信息 jdbc连接
  • –username mysql用户名
  • –password mysql密码
  • –table mysql表名
  • –hive-table hive表名 需要指定库
  • –fields-terminated-by 字段分割符
/export/server/sqoop/bin/sqoop create-hive-table --connect  jdbc:mysql://192.168.88.166:3306/users --username root --password 123456 --table tbl_users --hive-table users.tbl_users --fields-terminated-by '\t'
  • 1

sqoop导入数据指令

  • mysql数据导入数仓
  • import 根据mysql表创建
  • –connect mysql连接信息
  • –username 用户名
  • –password 密码
  • –table mysql表名
  • –hive-import 导入hive表
  • –hive-overwrite 覆盖导入
  • –hive-table hive表名
  • –fields-terminated-by 字段分割符
  • –delete-target-dir 如果存在表目录则删除后在再重新创建
  • –direct 直接导入模式 提升导入速度
  • –m 指定Maptask数量并行导入数据
/export/server/sqoop/bin/sqoop import --connect  jdbc:mysql://192.168.88.166:3306/users --username root --password 123456 --table tbl_users --hive-import --hive-overwrite  --hive-table users.tbl_users --fields-terminated-by '\t'  --delete-target-dir  --direct  --m  1
  • 1

编写sqoop脚本

qoop脚本就是将sqoop指令写入shell文件 后缀是 .sh

在这里插入图片描述

在这里插入图片描述

建表脚本

/export/server/sqoop/bin/sqoop \
create-hive-table \
--connect jdbc:mysql://192.168.88.166:3306/users \
--username root \
--password 123456 \
--table tbl_users \
--hive-table users.tbl_users \
--fields-terminated-by '\t'
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8

导入脚本

/export/server/sqoop/bin/sqoop \
import \
--connect  jdbc:mysql://192.168.88.166:3306/users \
--username root \
--password 123456 \
--table tbl_users \
--hive-import \
--hive-overwrite  \
--hive-table users.tbl_users \
--fields-terminated-by '\t'  \
--delete-target-dir  \
--direct  \
--m  1
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13

在这里插入图片描述

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/知新_RL/article/detail/864272
推荐阅读
相关标签
  

闽ICP备14008679号