当前位置:   article > 正文

Datax-web入门配置与启动

datax-web

在idea中启动Datax-web

需要先将Datax在本地安装,可以参考这篇文章(DataX在win10中的安装

1.从github上拉取源码

GitHub - WeiYe-Jing/datax-web: DataX集成可视化页面,选择数据源即可一键生成数据同步任务,支持RDBMS、Hive、HBase、ClickHouse、MongoDB等数据源,批量创建RDBMS数据同步任务,集成开源调度系统,支持分布式、增量同步数据、实时查看运行日志、监控执行器资源、KILL运行进程、数据源信息加密等。

2.在本地的mysql数据库中执行脚本文件创建数据库

2.1.修改脚本文件

增加几行代码

  1. DROP DATABASE IF EXISTS datax_web;
  2. CREATE DATABASE datax_web DEFAULT CHARACTER SET utf8 COLLATE utf8_general_ci;
  3. USE datax_web;

 2.2.在数据库中执行datax_web.sql脚本,生成datax_web库

3.修改配置文件

3.1.修改datax_admin下resources/application.yml文件

 下面的代码可以直接覆盖本地的(注意修改为自己的mysql账户名和密码)

  1. # 端口号
  2. server:
  3. port: 8080
  4. spring:
  5. #数据源,目前仅仅支持Mysql
  6. datasource:
  7. username: root
  8. password: 'root'
  9. url: jdbc:mysql://127.0.0.1:3306/datax_web?serverTimezone=Asia/Shanghai&useLegacyDatetimeCode=false&useSSL=false&nullNamePatternMatchesAll=true&useUnicode=true&characterEncoding=UTF-8
  10. driver-class-name: com.mysql.jdbc.Driver
  11. # 数据库连接池配置
  12. hikari:
  13. ## 最小空闲连接数量
  14. minimum-idle: 5
  15. ## 空闲连接存活最大时间,默认600000(10分钟)
  16. idle-timeout: 180000
  17. ## 连接池最大连接数,默认是10
  18. maximum-pool-size: 10
  19. ## 数据库连接超时时间,默认30秒,即30000
  20. connection-timeout: 30000
  21. connection-test-query: SELECT 1
  22. ##此属性控制池中连接的最长生命周期,值0表示无限生命周期,默认1800000即30分钟
  23. max-lifetime: 1800000
  24. # datax-web email 不需要可以不用配置
  25. mail:
  26. host: smtp.qq.com
  27. port: 25
  28. username:
  29. password:
  30. properties:
  31. mail:
  32. smtp:
  33. auth: true
  34. starttls:
  35. enable: true
  36. required: true
  37. socketFactory:
  38. class: javax.net.ssl.SSLSocketFactory
  39. management:
  40. health:
  41. mail:
  42. enabled: false
  43. server:
  44. servlet:
  45. context-path: /actuator
  46. mybatis-plus:
  47. # mapper.xml文件扫描
  48. mapper-locations: classpath*:/mybatis-mapper/*Mapper.xml
  49. # 实体扫描,多个package用逗号或者分号分隔
  50. #typeAliasesPackage: com.yibo.essyncclient.*.entity
  51. global-config:
  52. # 数据库相关配置
  53. db-config:
  54. # 主键类型 AUTO:"数据库ID自增", INPUT:"用户输入ID", ID_WORKER:"全局唯一ID (数字类型唯一ID)", UUID:"全局唯一ID UUID";
  55. id-type: AUTO
  56. # 字段策略 IGNORED:"忽略判断",NOT_NULL:"非 NULL 判断"),NOT_EMPTY:"非空判断"
  57. field-strategy: NOT_NULL
  58. # 驼峰下划线转换
  59. column-underline: true
  60. # 逻辑删除
  61. logic-delete-value: 0
  62. logic-not-delete-value: 1
  63. # 数据库类型
  64. db-type: mysql
  65. banner: false
  66. # mybatis原生配置
  67. configuration:
  68. map-underscore-to-camel-case: true
  69. cache-enabled: false
  70. call-setters-on-nulls: true
  71. jdbc-type-for-null: 'null'
  72. type-handlers-package: com.wugui.datax.admin.core.handler
  73. # 配置mybatis-plus打印sql日志
  74. logging:
  75. level:
  76. com.wugui.datax.admin.mapper: error
  77. path: ./data/applogs/admin
  78. #datax-job, access token
  79. datax:
  80. job:
  81. accessToken:
  82. #i18n (default empty as chinese, "en" as english)
  83. i18n:
  84. ## triggerpool max size
  85. triggerpool:
  86. fast:
  87. max: 200
  88. slow:
  89. max: 100
  90. ### log retention days
  91. logretentiondays: 30
  92. datasource:
  93. aes:
  94. key: AD42F6697B035B75

3.2.修改datax_executor下resources/application.yml文件

下面的代码可以直接覆盖本地

  1. # web port
  2. server:
  3. #port: ${server.port}
  4. port: 8081
  5. # 日志路径
  6. logging:
  7. config: classpath:logback.xml
  8. path: ./data/applogs/executor/jobhandler
  9. datax:
  10. job:
  11. admin:
  12. ### datax admin address list, http://address01,http://address02",data-admin的地址
  13. addresses: http://127.0.0.1:8080
  14. executor:
  15. appname: datax-executor # 创建执行器时的AppName需要和这里保持一致
  16. ip:
  17. port: 9999 # 执行器端口号
  18. ### job log path job文件的执行日志
  19. logpath: ./data/applogs/executor/jobhandler
  20. ### job log retention days
  21. logretentiondays: 30
  22. ### job, access token
  23. accessToken:
  24. executor:
  25. # datax json临时文件保存路径
  26. jsonpath: E:\datax\datax-web\temp\executor
  27. #jsonpath: ${json.path}
  28. # Datax执行文件datax.py的地址
  29. pypath: E:\datax\datax\bin\datax.py
  30. #pypath: ${python.path}

4.启动

运行datax_admin下 的DataXAdminApplication

运行datax_executor下 的DataXExecutorApplication

看个人习惯Run 或者 Debug 

 首次启动后,之后的启动可以直接选择左下角的spring boot启动

启动成功

 三个地址,两个接口文档地址,一个前端页面地址

5.配置hadoop

一般情况下,在启动后,控制台会报缺少hadoop的错误

就像下面这样,DataXAdminApplication运行一会儿会报错

需要配置hadoop的环境变量

GitHub - srccodes/hadoop-common-2.2.0-bin: hadoop-common-2.2.0/bin

下载压缩包后,解压即可

配置环境变量

HADOOP_HOME

D:\hadoop-common-2.2.0-bin-master

在系统变量Path中添加  %HADOOP_HOME%\bin

 环境变量配置后,再次启动Datax-web就不再有报错

声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:【wpsshop博客】
推荐阅读
  

闽ICP备14008679号