docker运行datax实现数据同步方案 --docker commit方式测试_docker datax

作者：凡人多烦事01 | 2024-02-28 13:43:50

踩

docker datax

公司的归档库正式提出要搭建了，于是纪录搭建归档库的方案和过程。

需要备份的库是生产Oracle主库，由于没有归档机制，公司经过8年时间的运行，对于多个表的数据查询已经累积到十亿级别，查询效率已经很低下了，鉴于数据库的IO压力，我提出了建立归档机制，把长时间不经常使用的数据转移到独立的数据库，保证生产的高效率。

归档方案是吧两年前的数据转移到归档库上，每天定时执行一次。

归档库的设计有多种选择，MySQL/Oracle或者其他数据库都可以，由于公司要求，暂定先转移到一个新的Oracle库。

之后需要确定同步方案了，如果只是Oracle-Oracle有很多中方式，或者官方自带的同步工具也很好用，当前公司采用的MySQL-Oracle同步方案用的kafuka然后再由程序去执行。鉴于后期可能会涉及多种数据同步计划，如同步到BI数据仓库、MySQL数据库等等，经调研，选择使用阿里的datax同步方案。

datax介绍在git上有官方说明，淘宝用这个工具已经使用6年以上，稳定和可靠性有一定保障，详细介绍我就不说明了，对于我采用它的最大原因是：datax像是一个中间抽取工具，可以对不同类型数据库进行读操作和写操作。

这点非常重要，因为后期可能会有Oracle转移到MySQL、Elasticsearch，所以最终没有选择其他工具。

确定了数据同步方案后，需要确定具体执行环境，是直接拿服务器跑还是在服务器docker上跑呢，公司服务器数量不多且资源紧张，datax可能还会被作为一个通用服务，最后决定用docker跑datax。</

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/凡人多烦事01/article/detail/159196