MySQL锁(三)行锁:幻读是什么?如何解决幻读?

概述

前面两篇文章介绍了MySQL的全局锁表级锁,今天就介绍一下MySQL的行锁。

MySQL的行锁是各个引擎内部实现的,不是所有的引擎支持行锁,例如MyISAM就不支持行锁。

不支持行锁就意味着在并发操作时,就要使用表锁,在任意时刻都只能有一个更新操作在执行,这样会影响业务的并发性。这也是为什么MyISAM会被InnoDB取代的原因之一。

行锁是锁里最小粒度的锁,InnoDB引擎里的行锁的实现算法有三种:

  • Record Lock:行锁,锁住记录本身
  • Gap Lock:间隙锁,锁住某个范围,但不包括记录本身
  • Next-Key Lock:Record Lock + Gap Lock,既锁范围,又锁记录

InnoDB是使用Next-Key Lock来解决幻读问题的。

什么是幻读?

我们看一下这个例子,有一个表 t,插入部分数据。

CREATE TABLE `t` (
  `id` int(11) NOT NULL,
  `c` int(11) DEFAULT NULL,
  `d` int(11) DEFAULT NULL,
  PRIMARY KEY (`id`),
  KEY `c` (`c`)
) ENGINE=InnoDB;

insert into t values(0,0,0),(5,5,5),
(10,10,10),(15,15,15),(20,20,20),(25,25,25);


图1 假设只在id=5这一行加行锁

有三个会话并发执行,Session A在T1,T3,T5时刻分别查询同一个语句,出现不同的结果。其中Q3读到的id=1这一行的现象,被称为幻读。

幻读,指同一个事务中,两次相同的查询操作,得到的结果行数不一样。

这里要对“幻读”做两点说明:

  1. 在可重复读隔离级别下,普通的查询是快照读,是不会看到别的事务插入的数据的。因此幻读在“当前读”下才会出现。
  2. 上面的Session B的修改结果,被Session A之后的select语句用“当前读”看到了,不能称为幻读。幻读仅专指“新插入的行”。

根据数据可见性规则分析,这三个查询都加了for update,都是“当前读”,符合数据可见性规则。

这么看来,好像没什么问题,是不是真的没有问题呢?

不,这里还真就有问题。

幻读有什么问题?

语义上不一致

Session A在T1时刻就声明了,“我要把所有d=5的行锁住,不准别的事务进行读写操作”。而实际上,这个语义被破坏了。

上面的例子可能还看不太出来,我们给Session B和Session C分别加两个语句,再看看会出现什么现象。



图2 假设只在id=5这一行加行锁–语义被破坏

Session B的第二条语句update t set c = 5 where id=0,语义是“我要把id=0、d=5的这一行的c的值改成了5”。

由于在T1时刻,Session A还只是给t=5这一行加了行锁,并没有给id=0这一行加锁。因此Session B在T2时刻,是可以执行这条语句的。

同理,Session C对id=1这行的修改,一样是破坏了Q1的加锁声明。

数据上不一致

其次是造成数据上不一致。锁的设计就是为了保证数据一致性的,这里的一致性除了内部数据在此刻的一致性外,还包含数据和日志在逻辑上的一致性。



图 3 假设只在id=5这一行加行锁–数据一致性问题

我们来分析一下图3执行完成后,数据库的数据是什么:

  1. 经过T1时刻,id=5这一行变成 (5,5,100),当然这个结果最终是在T6时刻正式提交的
  2. 经过T2时刻,id=0这一行变成(0,5,5);
  3. 经过T4时刻,表里面多了一行(1,5,5);

我们再来看看binlog的内容:

// session B
update t set d=5 where id=0;
update t set c=5 where id=0;

// session C
insert into t values(1,1,5);
update t set c=5 where id=1;

update t set d=100 where d=5;

按照这个语句序列,这三行的结果变成:(0,5,100),(1,5,100),(5,5,100)。

也就是说id=0和id=1这两行,发生了数据不一致。这个问题很严重,是不行的。

那究竟这个数据不一致是怎样引入的呢?



图 4 假设扫描到的行都被加上了行锁

假设我们对扫描到的行都加上行锁,来看看图4执行后会出现什么现象。

  1. 经过T1时刻,id=5这一行变成 (5,5,100),当然这个结果最终是在T6时刻正式提交的
  2. 经过T2时刻,Session B被阻塞,等到T6时刻Session A释放锁才能执行;
  3. 经过T4时刻,表里面多了一行(1,5,5);
  4. 经过T6时刻,id=1这一行变成(1,5,100);

id=1这一行还是出现数据不一致的问题。即使把所有的记录都加上锁,还是阻止不了新插入的记录。

如何解决幻读?

我们现在知道产生幻读的原因是,行锁只能锁住行,但是新插入记录这个动作,要更新的是记录之间的“间隙”。因此,为了解决幻读问题,InnoDB引入了间隙锁(Gap Lock)。

前面介绍过,间隙锁,锁住某个范围,但不包括记录本身。比如前面说到的表t,初始化有6条记录,这就产生了7个间隙。



图 5 表t主键索引上的行锁和间隙锁

当你执行select * from t where d=5 for update的时候,就不止是给数据库中6个记录加了行锁,还同时加了7个间隙锁。这样就确保了无法再插入新的记录。

也就是说这时候,在一行行扫描的过程中,不仅给行加上行锁,还给行两边的空隙也加上间隙锁。

我们回到上面的图4,再来看看加上间隙锁后,执行的效果如何。

  1. 经过T1时刻,id=5这一行变成 (5,5,100),当然这个结果最终是在T6时刻正式提交的。因为select * from t where d=6 for update,对6个记录加了行锁,同时加了7个间隙锁。
  2. 经过T2时刻,Session B被阻塞,因为id=0这一行被锁;
  3. 经过T4时刻,Session C被阻塞,因为主键索引上加了间隙锁(0,5),所以id=1这个值无法被插入;

Session B和Session C都要等待Session A释放锁后才能继续执行,这样就解决了幻读的问题。

行锁保证更新行,间隙锁保证插入行,而行锁+间隙锁=Next-Key Lock,也就是本文开头说到的,InnoDB是通过Next-Key Lock来解决幻读问题的。

但是间隙锁的引入,可能会导致同样的语句锁住更大的范围,这会影响并发度的。比如上面的select * from t where d=5 for update,相当于加了表锁。

参考资料

Tags: