当前位置:   article > 正文

hive与Oracle数据库的相互同步_oracle往hive迁表会丢失分区吗

oracle往hive迁表会丢失分区吗

1、Oracle数据同步到hive

1.1 不是分区表,覆盖数据

sqoop import --connect jdbc:oracle:thin:@ip:1521/服务名--username 用户名--password 密码 --table LTE_CELL_HIGHTRAFFIC_PRE --num-mappers 1  --fields-terminated-by "|" --hive-import --hive-table wxwy.lte_cell_hightraffic_pre --hive-overwrite  --hive-drop-import-delims
  • 1

1.2 分区表同步

    sqoop import --connect jdbc:oracle:thin:@ip:1521/服务名--username 用户名--password 密码--table LTE_CELL_HIGHTRAFFIC_PRE --num-mappers 1  --fields-terminated-by "|" --hive-import --hive-table wxwy.lte_cell_hightraffic_pre --target-dir /user/hive/warehouse/wxwy.db/lte_cell_hightraffic_pre/partitionday=20220213
  • 1

同步完后会发现无法查询出数据,此时需要标记表的分区信息

alter table LTE_CELL_HIGHTRAFFIC_PRE add partition(partitionday='20220213') location '/user/hive/warehouse/wxwy.db/lte_cell_hightraffic_pre/partitionday=20220213'
  • 1

数据验证
在这里插入图片描述2、Oracle同步到hive

 sqoop export \
 --connect jdbc:oracle:thin:@ip:1521/服务名--username 用户名 --password 密码\
 --table F_L_C_EUTRANCELLTDD_H \
 --columns \
 START_TIME,COLUMN1,COLUMN2,COLUMN3,EUTRANCELLTDD_UK ,COLUMN4,\
 COLUMN5,....COLUMNN \
 --fields-terminated-by "|" --update-key START_TIME,EUTRANCELLTDD_UK \
 --update-mode allowinsert --export-dir \
 /user/hive/warehouse/wxwy.db/f_l_c_eutrancelltdd_h/partitionday="20220213"/partitionhour="2022021310" \
 --num-mappers 8 --batch --input-null-string '\\N'  --input-null-non-string '\\N'\
 
为实现定时同步数据,定时脚本的配置信息
partitionday="$CustFunc:getTime(yyyyMMdd,-H2,partitionday)$"
partitionhour="$CustFunc:getTime(yyyyMMddHH,-H2,start_time)$"
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14

注意:
–table F_L_C_EUTRANCELLTDD_H \ 表名大写
–fields-terminated-by “|” --update-key START_TIME,EUTRANCELLTDD_UK \ START_TIME,EUTRANCELLTDD_UK 为Oracle表中约束字段

声明:本文内容由网友自发贡献,转载请注明出处:【wpsshop】
推荐阅读
相关标签
  

闽ICP备14008679号