当前位置:   article > 正文

docker运行datax实现数据同步方案 --docker commit方式测试_docker datax

docker datax

公司的归档库正式提出要搭建了,于是纪录搭建归档库的方案和过程。

 

需要备份的库是生产Oracle主库,由于没有归档机制,公司经过8年时间的运行,对于多个表的数据查询已经累积到十亿级别,查询效率已经很低下了,鉴于数据库的IO压力,我提出了建立归档机制,把长时间不经常使用的数据转移到独立的数据库,保证生产的高效率。

 

归档方案是吧两年前的数据转移到归档库上,每天定时执行一次。

归档库的设计有多种选择,MySQL/Oracle或者其他数据库都可以,由于公司要求,暂定先转移到一个新的Oracle库。

 

之后需要确定同步方案了,如果只是Oracle-Oracle有很多中方式,或者官方自带的同步工具也很好用,当前公司采用的MySQL-Oracle同步方案用的kafuka然后再由程序去执行。鉴于后期可能会涉及多种数据同步计划,如同步到BI数据仓库、MySQL数据库等等,经调研,选择使用阿里的datax同步方案。

 

datax介绍在git上有官方说明,淘宝用这个工具已经使用6年以上,稳定和可靠性有一定保障,详细介绍我就不说明了,对于我采用它的最大原因是:datax像是一个中间抽取工具,可以对不同类型数据库进行读操作和写操作。

这点非常重要,因为后期可能会有Oracle转移到MySQL、Elasticsearch,所以最终没有选择其他工具。

 

确定了数据同步方案后,需要确定具体执行环境,是直接拿服务器跑还是在服务器docker上跑呢,公司服务器数量不多且资源紧张,datax可能还会被作为一个通用服务,最后决定用docker跑datax。</

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/凡人多烦事01/article/detail/159196
推荐阅读
相关标签
  

闽ICP备14008679号