赞
踩
什么是事务?
一组由一个或多个数据库操作组成的操作组,能够原子的执行,且事务间相互独立;
简单来说,事务就是要保证一组数据库操作,要么全部成功,要么全部失败。
注:MySQL是一个支持多引擎的系统,并不是所有的引擎都支持事务。
提到事务,你肯定会想到ACID(Atomicity、 Consistency、 Isolation、 Durability),那么什么是ACID呢?
保证数据一致性,是事务操作的最终目的(AID皆为此);
当数据库上有多个事务同时执行的时候, 就可能出现脏读(dirtyread) 、 不可重复读(non-repeatable read) 、 幻读( phantom read) 的问题, 为了解决这些问题, 就有了“隔离级别”的概念。
在谈隔离级别之前, 你首先要知道, 隔离得越严实, 效率就会越低。 因此很多时候, 我们都要在二者之间寻找一个平衡点。
下面对SQL标准的事务隔离级别进行逐一介绍(隔离性由低到高):
其中“读提交”和“可重复读”比较难理解,下面用一个例子说明这几种隔离级别。
假设数据表T中只有一列, 其中一行的值为1, 下面是按照时间顺序执行两个事务的行为。
- mysql> create table T(c int) engine=InnoDB;
- insert into T(c) values(1);
接下来,我们看一下在不同隔离级别下,事务A会有哪些不同的返回结果:
在实现上,数据库里面会创建一个视图,访问的时候以视图的逻辑结果为准。
注1:“读未提交”隔离级别下直接返回记录上的最新值,所以没有视图概念。而“串行化”隔离级别下直接使用加锁的方式来避免并发访问。
注2:不同数据库其默认隔离级别有所差异。Oracle默认隔离界别为“读提交”,因此对于一些从Oracle迁移到MySQL的应用,为保证数据库隔离级别的一致,需要把MYSQL隔离级别设为“读提交”,MySQL默认隔离级别为“可重复读”。
下面以“可重复读”隔离级别为例,介绍事务隔离是怎么实现的。
在MySQL中,实际上每条记录在更新的时候都会记录一条回滚操作。记录上的最新值,通过回滚操作,都可以得到前一个状态值。
假设一个值从1被按顺序改成了2、3、4,在回滚日志里面就会有类似下面的记录:
记录当前值是4,在查询记录时,不同时刻启动的事务会有不同的read-view。在视图A、B、C里面,这一个记录的值分别是1、2、4,同一条记录在系统中可以存在多个版本,就是数据库的多版本并发控制(MVCC);对于read-view A,要得到1,就必须将当前值依次执行图中所有的回滚操作得到。
同时你会发现, 即使现在有另外一个事务正在将4改成5, 这个事务跟read-view A、 B、 C对应的事务是不会冲突的。
问:回滚日志什么时候删除?
当没有事务再需要用到这些回滚段日志时,回滚日志会被删除。即当系统里没有比这个回滚日志更早的read-view的时候。(换句话说,回滚日志一般在当前视图所在事务中才会被用到)
问:为什么建议尽量不要使用长事务?
1)长事务表示系统存在很老的事务视图。这些事务可能访问数据库的任何数据,所以事务提交前,可能用到的回滚记录必须保留,导致回滚记录占用大量存储空间;
2)回滚日志跟数据字典一起放在ibdata文件中,即使长事务提交,回滚段被清理,文件也不会变小。我见过数据只有20GB,而回滚段有200GB的库。最终只好为了清理回滚段,重建整个库。( MySQL
3)长事务还占用锁资源,也可能拖垮整个库;
问:为避免长事务,业务开发和DBA分别应该采取哪些措施?
业务侧:
1)去掉没必要的事务,比如查询语句;
2)设置SQL执行超时时间;
DBA侧:
1)监控 information_schema.Innodb_trx表,设置长事务阈值,超过就报警/或者kill;
2)Percona的pt-kill这个工具不错,推荐使用;
3)在业务功能测试阶段要求输出所有的general_log,分析日志行为提前发现问题;
4)把innodb_undo_tablespaces设置>=2,出现大事务导致回滚段过大,方便清理。(MySQL >= 5.6)
autocommit用于决定是否开启事务自动提交:
1)autocommit=0
2)autocommit=1
注:有些客户端连接框架会默认连接成功后先执行一个set autocommit=0的命令。这可能导致接下来的查询都在事务中,如果是长连接,就可能导致了意外的长事务;比如Java的Spring框架,可以显式告诉驱动,是否在事务环境中执行语句。
问:事务在什么时候会被隐式提交?
1)当设置autocommit = 1时,对于已经开启但是未提交的事务,若遇到DDL/begin/lock table/unlock table等语句时,会自动提交上一个事务;
2)当设置autocommit = 0时,对于已经开启但是未提交的事务,若遇到DDL/begin/lock table/unlock table等语句时,会自动回滚上一个事务;
MVCC在InnoDB引擎层基于read view实现。
问:什么是事务ID?
1)引擎层用于唯一标识事务的ID,在事务开始时由InnoDB事务系统分配,按申请顺序严格递增;越早发起的事务,事务ID越小;
2)begin/start transaction命令不是InnoDB事务的起点,故不会生成事务ID;直到执行变更InnoDB表的语句,才会生成事务ID;
问:什么是数据版本?
1)每行数据有多个版本,按照事务ID倒序排列,每次事务更新数据时,会生成一个新的数据版本,并在版本中记录事务ID,即row trx_id;
2)数据表中的一行记录,可能有多个版本(row),每个版本有自己的row trx_id,可通过遍历拿到对应trx_id的版本;
3)数据版本存放在undo log中,每次查询时根据当前版本和undo log向前推算得出结果。比如,查询V2时,通过V4依次执行V3、V2算出来;
MVCC 并发控制原理详见:MVCC 并发控制原理-源码解析(非常详细)-CSDN博客
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。