当前位置:   article > 正文

MYSQL数据恢复之binlog2sql

binlog2sql

关于数据恢复之前已分享过2篇,链接如下:

MySQL数据备份及还原(一)

MySQL数据备份及还原(二)

今天分享一下binlog2sql,它是一款比较常用的数据恢复工具,可以通过它从MySQL binlog解析出你要的SQL,并根据不同选项,可以得到原始SQL、回滚SQL、去除主键的INSERT SQL等。主要用途如下:

  • 数据快速回滚(闪回)
  • 主从切换后新master丢数据的修复
  • 从binlog生成标准SQL,带来的衍生功能

1 系统环境准备

1.1 安装git

该项目分享与git上,可以直接从git上获取,因此可以先安装git

yum install  -y  pip

复制

1.2 安装python

因binlog2sql依赖于python2.7或python3.4+版本,如果本机python版本较低,则无法使用。安装或升级python的方法可以参考 《python安装及升级》

1.3 安装pip

如果系统中没有安装pip,则需要先安装pip,因为后续需要用pip安装python所需的包。安装方法可以参考历史文章中的 《一分钟搞定pip安装》

1.4 binlog2sql下载及依赖包安装

binlog2sql可以部署在其他机器上,而不是必须部署在mysql服务端上

  1. git clone https://github.com/danfengcao/binlog2sql.git && cd binlog2sql
  2. pip install -r requirements.txt

复制

2 MySQL环境准备

2.1 参数设置

MySQL server必须设置以下参数

  1. [mysqld]
  2. server_id = 128
  3. log_bin = /data/mysql/mysql3306/logs/mysql-bin
  4. max_binlog_size = 512M
  5. binlog_format = row
  6. binlog_row_image = full # 默认值,可以不显式设置

复制

2.2 创建恢复账号

因binlog2sql是通过模拟从库的方式获取binlog,所以,数据库账号权限至少需设置为从库所需的权限。

  1. -- 创建用户
  2. mysql> create user data_rec@'192.168.56.%' identified by 'xxxxxxxx';
  3. Query OK, 0 rows affected (0.01 sec)
  4. -- 授权
  5. mysql> GRANT SELECT, REPLICATION SLAVE, REPLICATION CLIENT ON *.* TO data_rec@'192.168.56.%';
  6. Query OK, 0 rows affected (0.00 sec)

复制

权限说明:

  • select:需要读取server端information_schema.COLUMNS表,获取表结构的元信息,拼接成可视化的sql语句
  • super/replication client:两个权限都可以,需要执行'SHOW MASTER STATUS', 获取server端的binlog列表
  • replication slave:通过BINLOG_DUMP协议获取binlog内容的权限

2.3 创建测试表及数据

  1. mysql> use testdb;
  2. Database changed
  3. mysql> create table t_test1 (id int primary key auto_increment ,c_name varchar(20), c_num int );
  4. Query OK, 0 rows affected (0.02 sec)
  5. mysql> insert into t_test1(c_name,c_num) values('aaaa',10),('abcc',15),('bacess',9),('andd',10);
  6. Query OK, 4 rows affected (0.03 sec)
  7. Records: 4 Duplicates: 0 Warnings: 0
  8. mysql> insert into t_test1(c_name,c_num) values('bbbaa',1),('dc',5),('vgcess',29),('hdgd',0);
  9. Query OK, 4 rows affected (0.01 sec)
  10. Records: 4 Duplicates: 0 Warnings: 0

复制

2.4 模拟误删除数据

  1. mysql> select now();
  2. +---------------------+
  3. | now() |
  4. +---------------------+
  5. | 2020-09-18 16:29:08 |
  6. +---------------------+
  7. 1 row in set (0.00 sec)
  8. mysql> delete from t_test1;
  9. Query OK, 8 rows affected (0.00 sec)
  10. mysql> select now();
  11. +---------------------+
  12. | now() |
  13. +---------------------+
  14. | 2020-09-18 16:29:26 |
  15. +---------------------+
  16. 1 row in set (0.00 sec)

复制

3 binlog2sql恢复数据

3.1 生成恢复SQL

因知道大概误删除的时间,因此通过解析对应时间的binlog恢复出指定库表的数据,生成的结果是用于恢复的sql

python binlog2sql.py  --flashback  -h 192.168.56.128 -udata_rec -p'xxxxxxxx' -d testdb  -t t_test1  --start-file='mysql-bin.000003' --start-datetime='2020-09-18 16:29:08' --stop-datetime='2020-09-18 16:30:00'  >/tmp/rec.sql

复制

结果内容如下

复制

3.2 恢复数据

  1. mysql> select * from t_test1;
  2. Empty set (0.00 sec)
  3. mysql> source /tmp/rec.sql;
  4. Query OK, 1 row affected (0.00 sec)
  5. Query OK, 1 row affected (0.00 sec)
  6. Query OK, 1 row affected (0.00 sec)
  7. Query OK, 1 row affected (0.00 sec)
  8. Query OK, 1 row affected (0.00 sec)
  9. Query OK, 1 row affected (0.01 sec)
  10. Query OK, 1 row affected (0.00 sec)
  11. Query OK, 1 row affected (0.00 sec)
  12. mysql> select * from t_test1;
  13. +----+--------+-------+
  14. | id | c_name | c_num |
  15. +----+--------+-------+
  16. | 1 | aaaa | 10 |
  17. | 2 | abcc | 15 |
  18. | 3 | bacess | 9 |
  19. | 4 | andd | 10 |
  20. | 5 | bbbaa | 1 |
  21. | 6 | dc | 5 |
  22. | 7 | vgcess | 29 |
  23. | 8 | hdgd | 0 |
  24. +----+--------+-------+
  25. 8 rows in set (0.00 sec)

复制

数据已恢复。

4 使用说明

参考原文链接:https://github.com/danfengcao/binlog2sql

4.1 解析模式

--stop-never 持续解析binlog。可选。默认False,同步至执行命令时最新的binlog位置。一般情况下解析单个binlog即可,但是如果需要回退的表之后有操作,则可能需要持续解析 -K, --no-primary-key 对INSERT语句去除主键。可选。默认False。 -B, --flashback 生成回滚SQL,可解析大文件,不受内存限制。可选。默认False。与stop-never或no-primary-key不能同时添加。该情况用的较多 --back-interval -B模式下,每打印一千行回滚SQL,加一句SLEEP多少秒,如不想加SLEEP,请设为0。可选。默认1.0。

4.2 解析范围控制

--start-file 起始解析文件,只需文件名,无需全路径 ,必选参数。即指定对应的binlog起始文件名 --start-position/--start-pos 起始解析位置。可选。默认为start-file的起始位置。 --stop-file/--end-file 终止解析文件。可选。默认为start-file同一个文件。若解析模式为stop-never,此选项失效。 --stop-position/--end-pos 终止解析位置。可选。默认为stop-file的最末位置;若解析模式为stop-never,此选项失效。 --start-datetime 起始解析时间,格式'%Y-%m-%d %H:%M:%S'。可选。默认不过滤。 --stop-datetime 终止解析时间,格式'%Y-%m-%d %H:%M:%S'。可选。默认不过滤。

4.3 对象过滤

-d, --databases 只解析目标db的sql,多个库用空格隔开,如-d db1 db2。可选。默认为空。 -t, --tables 只解析目标table的sql,多张表用空格隔开,如-t tbl1 tbl2。可选。默认为空。 --only-dml 只解析dml,忽略ddl。可选。默认False。 --sql-type 只解析指定类型,支持INSERT, UPDATE, DELETE。多个类型用空格隔开,如--sql-type INSERT DELETE。可选。默认为增删改都解析。用了此参数但没填任何类型,则三者都不解析。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/Guff_9hys/article/detail/955292
推荐阅读
  

闽ICP备14008679号