谈谈Java事务

事务具基本特征(ACID)


Atomi(原子性):事务中包含的操作被看做一个整,要么完全部成功,要么全部失败。

② Consistency(一致性):事务在完成时,必须是所有的数据都保持一致状态,保证了数据的完整性和一致性。

③ Isolation(隔离性):当多个用户并发访问数据库时,比如操作同一张表时,数据库为每一个用户开启的事务,不能被其他事务的操作所干扰,多个并发事务之间要相互隔离。

这里的隔离性就是下面我们要说的隔离级别,为了减少事务在修改数据上的相互影响。

④ Durability(持久性):一个事务一旦被提交了,那么对数据库中的数据的改变就是永久性的,即便数据库系统遇到故障也不会丢失提交事务的操作。

事务的传播行为


事务传播行为(propagation behavior)指的就是当一个事务方法A被另一个事务方法B调用时,这个事务方法A应该如何进行。换句话说,需要发生方法件的调用,才会存在传播行为,对于单个事务方法而已,没有传播的概念。

传播行为 含义 应用场景
REQUIRED 默认传播行为,当前上下文不存在事务,所以会开启一个新的事务,当上下文存在事务,则融入当前事务(它是个机会主义者,既可以暗度陈仓,也可以独当一面) 大部分简单场景
SUPPORTS 如果存在一个事务,支持当前事务。如果没有事务,则非事务的执行(它是个保守派,随波逐流,从不另起炉灶) 查询
MANDATORY 如果存在一个事务,支持当前事务。如果没有一个活动的事务,则抛出异常(它是个独裁者,只许州官放火,不许百姓点灯)
REQUIRES_NEW 它会开启一个新的事务。如果一个事务已经存在,则先将这个存在的事务挂起。(它是个革新派,开天辟地) 批量操作时,需要对单调数据进行控制
NOT_SUPPORTED 总是非事务地执行,并挂起任何存在的事务(他是个悲观主义者,不主动,谁来都拒绝)
NEVER 总是非事务地执行,如果存在一个活动事务,则抛出异常(怎么说,这个有点反人类)
NESTED 嵌套事务一个非常重要的概念就是内层事务依赖于外层事务。外层事务失败时,会回滚内层事务所做的动作。而内层事务操作失败并不会引起外层事务的回滚。(害,活像一个爱情弱势方,受害者,左右不了对方,被对方左右)

事务的隔离级别


准确来说,事务的隔离级别只有四个,分别为:

  • 读未提交(READ_UNCOMMITTED)
  • 读已提交(READ_COMMITTED)
  • 可重复读(REPEATABLE_READ)
  • 串行化(SERIALIZABLE)

单单看这几个字有点干,其他的先不管,先来看一下他们都能解决啥问题,以及无法解决什么问题先

异常现象 脏读 不可重复读 幻读
未提交读
读写提交 ×
可重复读 × ×
串行化 × × ×

如何理解上面这个表格呢?首先,如果是简单的查询,那是不存在的什么问题的,因为你只进行了查询而已。那么如果你有对数据库的更新修改操作,是不是就会产生问题呢?不一定,如果这个时间内只有一个事务,那你做再多的操作,都是不会有问题的,要么这个事务的操作全部成功,要么全部失败。所以在对事务产生问题的讨论上,都是针对并发事务。这一点与事务的传播性的特点一样。简单的理解,就是同一时间,对同一数据有多个事务在操作。

那我们都知道,每一个事务的里的操作,都会被计算机分割成很多的原子操作,由cpu进行调度执行,所以就涉及这些操作的一个排列问题,但我们知道cpu的调度是随机的,所以的就会产生很多可能性。这些操作的执行顺序,导致了面临一些问题。

最低级别读未提交(READ_UNCOMMITTED),什么问题都有可能发生,不适合并发事务场景

由上面所提到的事务的持久性可以得知,事务的持久化,是建立在事务被提交的基础上的。也就是说,事务A没提交,对数据的操作都不算真正的生效,那么如果在未提交前,被别的事务B的读取到这部分数据,那么你最终提交的化还好,严格来说不算脏数据,但假如事务A回滚了,那读的这部分数据其实是错误的,我们把它称之为“脏数据”,这是并发事务面临的第一个问题。

要解决“脏数据”问题,就必须保证一个事务不会读到另一个并行事务已修改但未提交的数据,这正是读已提交(READ_COMMITTED)隔离级别所要求的。换句话说就是“我修改的数据还没提交你不能读”。解决了脏数据问题后。我读到的数据的确都是“生效”的了。

但这会带来一个问题,单事务A需要对一个数据多次读取的时候,中间可能存在一个可能:事务B修改这个数据了,由该级别读到的数据是已提交可知,事务B对数据的修改操作肯定是生效的了,所以事务A多次读到的结果可能不一致,这就是“不可重复读”问题。

要解决“不可重复读”问题,很显然,我就得加强约束,上一级是我修改的数据还没提交你不能读,这次是当我读数据开始,到我所在的事务还没提交之前,你不能读,这意味着不管事务A读数据后有多少操作,并发事务B都得等待,可以看到的“锁住”的范围更大了,也相应带来更大的损耗。此时解决重复读的问题,级别是可重复读(REPEATABLE_READ)

但可重复读级别解决的是同一竞争数据的重复读问题,假如事务A多次通过特定条件多次读取m条数据,有事务C,插入n条数据服务事务A查询条件,或者修改了其他t条数据同样符合事务A的条件,那事务A后面读取可能就是m+n或m+t条数据了,此为”幻读“现象,要解决此问题

要解决幻读现象,只能祭出最后杀招,串行化(SERIALIZABLE)级别

总结如下

隔离等级 含义
READ_UNCOMMITTED 最低等级,从上表可以看到,啥问题解决不了,所以当并发事务操作同一数据时,啥情况都可能发生,所以一般不用于并发事务场景
READ_COMMITTED 保证了一个事务不会读到另一个并行事务已修改但未提交的数据
REPEATABLE_READ 保证了一个事务不会修改已经由另一个事务读取但未提交(回滚)的数据
SERIALIZABLE 最严格的级别,事务串行执行,资源消耗最大

数据库实现


未提交读的数据库锁情况(实现原理)

事务在读数据的时候并未对数据加锁。

务在修改数据的时候只对数据增加行级共享锁

提交读的数据库锁情况

事务对当前被读取的数据加 行级共享锁(当读到时才加锁),一旦读完该行,立即释放该行级共享锁

事务在更新某数据的瞬间(就是发生更新的瞬间),必须先对其加 行级排他锁,直到事务结束才释放。

可重复读的数据库锁情况

事务在读取某数据的瞬间(就是开始读取的瞬间),必须先对其加 行级共享锁,直到事务结束才释放;

事务在更新某数据的瞬间(就是发生更新的瞬间),必须先对其加 行级排他锁,直到事务结束才释放。

可序列化的数据库锁情况

事务在读取数据时,必须先对其加 表级共享锁 ,直到事务结束才释放;

事务在更新数据时,必须先对其加 表级排他锁 ,直到事务结束才释放。

参考资料


数据库隔离级别 及 其实现原理