当前位置:   article > 正文

用SQOOP抽取Oracle到HIVE_sqoop抽取oracle数据到hive

sqoop抽取oracle数据到hive
  1. # 定义变量名字
  2. hive='/usr/bin/hive'
  3. hive_database=''
  4. field_segmentation='\001'
  5. external_storage_path='/user/hive/warehouse/HDFS文件路径'
  6. source_database=''
  7. source_username=''
  8. source_pwd=''
  9. source_ip=''
  10. source_port='1521'
  11. if [ -n "$1" ] ;then
  12.     do_day=$1
  13. else
  14.     do_day=`date -d "-1 day" +%F`
  15. fi
  16. /usr/bin/sqoop import \
  17. --connect "jdbc:oracle:thin:@//$source_ip:$source_port/$source_database" \
  18. --username $source_username \
  19. --password $source_pwd \
  20. --query "select 每个字段都要写上 from 表哥表姐表叔 where \$CONDITIONS " \
  21. --hive-delims-replacement '<br/>' \
  22. --num-mappers 1 \
  23. --fields-terminated-by $field_segmentation \
  24. --target-dir $external_storage_path/表名_tmp \
  25. --delete-target-dir \
  26. --null-string '\\N' \
  27. --null-non-string '\\N' \
  28. --hive-import \
  29. --hive-database $hive_database \
  30. --hive-table HIVE表名 \
  31. --hive-overwrite \
  32. --hive-partition-key dt \
  33. --hive-partition-value $do_day
  34. if [ $? -eq 0 ];then
  35.     echo "============<OK时间为[`date "+%Y-%m-%d %H:%M:%S"`]>============"
  36. else
  37.     echo "============<失败, 时间为[`date "+%Y-%m-%d %H:%M:%S"`]>============"
  38.     exit 1
  39. fi

本文内容由网友自发贡献,转载请注明出处:【wpsshop博客】
推荐阅读
相关标签
  

闽ICP备14008679号