赞
踩
DataX 是阿里巴巴集团内被广泛使用的离线数据同步工具/平台,实现包括 MySQL、Oracle、HDFS、Hive、OceanBase、HBase、OTS、ODPS 等各种异构数据源之间高效的数据同步功能。DataX采用了框架 + 插件 的模式,目前已开源,代码托管在github。
下载页面地址:https://github.com/alibaba/DataX 在页面中【Quick Start】--->【Download DataX下载地址】进行下载。下载后的包名:datax.tar.gz。解压后{datax}目录下有{bin conf job lib log log_perf plugin script tmp}几个目录。
将下载后的压缩包直接解压后可用,前提是对应的java及python环境满足要求。
System Requirements:
配置测试样例:下面我们配置一组 从mysql数据库到另一个mysql数据库。
可以通过命令查看配置模板:
python datax.py -r {YOUR_READER} -w {YOUR_WRITER} 当然也可以从https://github.com/alibaba/DataX自行配置。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。