赞
踩
Apache DolphinScheduler 是一个分布式易扩展的可视化DAG工作流任务调度开源系统。适用于企业级场景,提供了一个可视化操作任务、工作流和全生命周期数据处理过程的解决方案。
Apache DolphinScheduler 旨在解决复杂的大数据任务依赖关系,并为应用程序提供数据和各种 OPS 编排中的关系。 解决数据研发ETL依赖错综复杂,无法监控任务健康状态的问题。 DolphinScheduler 以 DAG(Directed Acyclic Graph,DAG)流式方式组装任务,可以及时监控任务的执行状态,支持重试、指定节点恢复失败、暂停、恢复、终止任务等操作。
MasterServer
MasterServer采用分布式无中心设计理念,MasterServer主要负责 DAG 任务切分、任务提交监控,并同时监听其它MasterServer和WorkerServer的健康状态。 MasterServer服务启动时向Zookeeper注册临时节点,通过监听Zookeeper临时节点变化来进行容错处理。 MasterServer基于netty提供监听服务。
该服务内主要包含:
WorkerServer
WorkerServer也采用分布式无中心设计理念,WorkerServer主要负责任务的执行和提供日志服务。 WorkerServer服务启动时向Zookeeper注册临时节点,并维持心跳。 WorkerServer基于netty提供监听服务。
该服务包含:
ZooKeeper
AlertServer
ApiServer
UI
本次以单机为例:
需要安装JDK(1.8+),并配置JAVA_HOME环境变量
下载地址:DolphinScheduler | 下载 (apache.org)
tar -zxvf apache-dolphinscheduler-3.2.0-bin.tar.gz
- #启动服务
- ./bin/dolphinscheduler-daemon.sh start standalone-server
-
- #停止服务
- ./bin/dolphinscheduler-daemon.sh stop standalone-server
登陆地址
端口:12345
单机版dolphinscheduler是采用H2存储元数据,每次重启服务都会清空数据,所以我们需要切换到MySQL数据库解决这个问题。
首先在MySQL数据库建一个dolphinscheduler数据库
然后编辑dolphinscheduler_env.sh文件
vim ./bin/env/dolphinscheduler_env.sh
- export DATABASE=mysql
- export SPRING_PROFILES_ACTIVE=${DATABASE}
- export SPRING_DATASOURCE_URL="jdbc:mysql://127.0.0.1:3306/ds3?useUnicode=true&characterEncoding=UTF-8&useSSL=false"
- export SPRING_DATASOURCE_USERNAME=用户
- export SPRING_DATASOURCE_PASSWORD=密码
-
初始化数据库
sh tools/bin/upgrade-schema.sh
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。