当前位置:   article > 正文

ETL系列:一、DataX的安装与使用_datax插件下载

datax插件下载

一、引言

DataX 是阿里云的开源版本,在阿里巴巴集团内被广泛使用的离线数据同步工具。DataX 实现了包括 MySQL、Oracle、HDFS、Hive、HBase 等各种异构数据源之间高效的数据同步功能。

DataX本身作为数据同步框架,将不同数据源的同步抽象为从源头数据源读取数据的Reader插件,以及向目标端写入数据的Writer插件,理论上DataX框架可以支持任意数据源类型的数据同步工作。同时DataX插件体系作为一套生态系统, 每接入一套新数据源该新加入的数据源即可实现和现有的数据源互通。

二、安装

1、github地址

GitHub - alibaba/DataX: DataX是阿里云DataWorks数据集成的开源版本。

2、安装包下载地址

https://datax-opensource.oss-cn-hangzhou.aliyuncs.com/202303/datax.tar.gz

3、安装

  1. #解压
  2. tar -xvf datax.tar.gz

4、安装效果

任务示例脚本存放目录:/job

三、编写脚本测试验证

1、编写一个简单脚本test.json(oracle同步至oracle)

脚本中各个参数的用法请参考官方文档使用说明。如:本脚本reader中的"splitPk": "cust_no",指定按照cust_no进行分组子任务并行执行,用来提升同步效率。

  1. {
  2. "job": {
  3. "setting": {
  4. "speed": {
  5. "channel": 5
  6. },
  7. },
  8. "content": [
  9. {
  10. "reader": {
  11. "name": "oraclereader",
  12. "parameter": {
  13. "username": "***",
  14. "password": "***",
  15. "column": [
  16. "cust_no",
  17. "fund_acco_no",
  18. "agency_no",
  19. "fund_code",
  20. "share_type",
  21. "last_shares",
  22. "d_cdate",
  23. "ta_no",
  24. "cust_type",
  25. "trade_acco_no"
  26. ],
  27. "connection": [
  28. {
  29. "table": [
  30. "t_c_bal_fund_bak"
  31. ],
  32. "jdbcUrl": [
  33. "jdbc:oracle:thin:@172.*.*.*:1521/*"
  34. ]
  35. }
  36. ],
  37. "where":"1=1",
  38. "splitPk": "cust_no",
  39. "sliceRecordCount": 500000
  40. }
  41. },
  42. "writer": {
  43. "name": "oraclewriter",
  44. "parameter": {
  45. "username": "***",
  46. "password": "***",
  47. "column": [
  48. "cust_no",
  49. "fund_acco_no",
  50. "agency_no",
  51. "fund_code",
  52. "share_type",
  53. "last_shares",
  54. "fdate",
  55. "ta_no",
  56. "cust_type",
  57. "trade_acco_no"
  58. ],
  59. "connection": [
  60. {
  61. "table": [
  62. "t_c_bal_fund"
  63. ],
  64. "jdbcUrl": "jdbc:oracle:thin:@172.*.*.*:1521/*"
  65. }
  66. ]
  67. }
  68. }
  69. }
  70. ]
  71. }
  72. }

2、上传至安装目录

/data/datax/datax/job

3、执行任务

python /data/datax/datax/bin/datax.py /data/datax/datax/job/test.json

4、执行效果

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/Monodyee/article/detail/442521
推荐阅读
相关标签
  

闽ICP备14008679号