不能回滚的Redis事务还能用吗
前言
事务是关系型数据库的特征之一,那么作为 Nosql
的代表 Redis
中有事务吗?如果有,那么 Redis
当中的事务又是否具备关系型数据库的 ACID
四大特性呢?
Redis 有事务吗
这个答案可能会令很多人感到意外,Redis
当中是存在“事务”的。这里我把 Redis
的事务带了引号,原因在后面分析。
Redis
当中的单个命令都是原子操作,但是如果我们需要把多个命令组合操作又需要保证数据的一致性时,就可以考试使用 Redis
提供的事务(或者使用前面介绍的 Lua
脚本)。
Redis
当中,通过下面 4
个命令来实现事务:
multi
:开启事务exec
:执行事务discard
:取消事务watch
:监视
Redis
的事务主要分为以下 3
步:
- 执行命令
multi
开启一个事务。 - 开启事务之后执行的命令都会被放入一个队列,如果成功之后会固定返回
QUEUED
。 - 执行命令
exec
提交事务之后,Redis
会依次执行队列里面的命令,并依次返回所有命令结果(如果想要放弃事务,可以执行discard
命令)。
接下来让我们依次执行以下命令来体会一下 Redis
当中的事务:
multi //开启事务
set name lonely_wolf //设置 name,此时 Redis 会将命令放入队列
set age 18 //设值 age,此时 Redis 会将命令放入队列
get name //获取 name,此时 Redis 会将命令放入队列
exec //提交事务,此时会依次执行队列里的命令,并依次返回结果
执行完成之后得到如下效果:
Redis 事务实现原理
Redis
中每个客户端都有记录当前客户端的事务状态 multiState
,下面就是一个客户端 client
的数据结构定义:
typedef struct client {
uint64_t id;//客户端唯一 id
multiState mstate; //MULTI 和 EXEC 状态(即事务状态)
//...省略其他属性
} client;
multiState
数据结构定义如下:
typedef struct multiState {
multiCmd *commands;//存储命令的 FIFO 队列
int count;//命令总数
//...省略了其他属性
} multiState;
multiCmd
是一个队列,用来接收并存储开启事务之后发送的命令,其数据结构定义如下:
typedef struct multiCmd {
robj **argv;//用来存储参数的数组
int argc;//参数的数量
struct redisCommand *cmd;//命令指针
} multiCmd;
我们以上面事务的示例截图中事务为例,可以得到如下所示的一个简图:
Redis 事务 ACID 特性
传统的关系型数据库中,一个事务一般都具有 ACID
特性。那么现在就让我们来分析一下 Redis
是否也满足这 ACID
四大特性。
A – 原子性
在讨论事务的原子性之前,我们先来看 2
个例子。
- 模拟事务在执行命令前发生异常。依次执行以下命令:
multi //开启事务
set name lonely_wolf //设置 name,此时 Redis 会将命令放入队列
get //执行一个不完成的命令,此时会报错
exec //在发生异常后提交事务
最终得到了如下图所示的结果,我们可以看到,当命令入队的时候报错时,事务已经被取消了:
- 模拟事务在执行命令前发生异常。依次执行以下命令:
flushall //为了防止影响,先清空数据库
multi //开启事务
set name lonely_wolf //设置 name,此时 Redis 会将命令放入队列
incr name //这个命令只能用于 value 为整数的字符串对象,此时执行会报错
exec //提交事务,此时在执行第一条命令成功,执行第二条命令失败
get name //获取 name 的值
最终得到了如下图所示的结果,我们可以看到,当执行事务报错的时候,之前已经成功的命令并没有被回滚,也就是说在执行事务的时候某一个命令失败了,并不会影响其他命令的执行,即 Redis
的事务并不会回滚:
Redis 中的事务为什么不会滚
这个问题的答案在 Redis
官网中给出了明确的解释:
总结起来主要就是 3
个原因:
Redis
作者认为发生事务回滚的原因大部分都是程序错误导致,这种情况一般发生在开发和测试阶段,而生产环境很少出现。- 对于逻辑性错误,比如本来应该把一个数加
1
,但是程序逻辑写成了加2
,那么这种错误也是无法通过事务回滚来进行解决的。 Redis
追求的是简单高效,而传统事务的实现相对比较复杂,这和Redis
的设计思想相违背。
C – 一致性
一致性指的就是事务执行前后的数据符合数据库的定义和要求。这一点 Redis
中的事务是符合要求的,上面讲述原子性的时候已经提到,不论是发生语法错误还是运行时错误,错误的命令均不会被执行。
I – 隔离性
事务中的所有命令都会按顺序执行,在执行 Redis
事务的过程中,另一个客户端发出的请求不可能被服务,这保证了命令是作为单独的独立操作执行的。所以 Redis
当中的事务是符合隔离性要求的。
D – 持久性
如果 Redis
当中没有被开启持久化,那么就是纯内存运行的,一旦重启,所有数据都会丢失,此时可以认为 Redis
不具备事务的持久性;而如果 Redis
开启了持久化,那么可以认为 Redis
在特定条件下是具备持久性的。
watch 命令
上面我们讲述 Redis
中事务时,提到的的常用命令还有一个 watch
命令,这个又是做什么用的呢?我们还是先来看一个例子。
首先打开一个客户端一,依次执行以下命令:
flushall //清空数据库
multi //开启事务
get name //获取 name,此时正常返回 nil
set name lonely_wolf //设置 name
get name //获取 name,此时正常应该返回 lonely_wolf
得到如下效果图:
这时候我们先不执行事务,打开另一个客户端二,来执行一个命令 set name zhangsan
:
客户端二执行成功了,这时候再返回到客户端一执行 exec
命令:
可以发现,第一句话返回了 zhangsan
。也就是说,name
这个 key
值在入队之后到 exec
之前发生了变化,一旦发生这种情况,可能会引起很严重的问题,所以在关系型数据库可以通过锁来解决这种问题,那么 Redis
当中试如何解决的呢?
是的,在 Redis
当中就是通过 watch
命令来处理这种场景的。
watch 命令的作用
watch
命令可以为 Redis
事务提供 CAS
乐观锁行为,它可以在 exec
命令执行之前,监视任意 key
值的变化,也就是说当多个线程更新同一个 key
值的时候,会跟原值做比较,一旦发现它被修改过,则拒绝执行命令,并且会返回 nil
给客户端。
下面还是让我们通过一个示例来演示一下。
打开一个客户端一,依次执行如下命令:
flushall //清空数据库
watch name //监视 name
multi //开启事务
set name lonely_wolf //设置 name
set age 18 // 设置 age
get name //获取 name
get age //获取 age
执行之后得到如下效果图:
这时候再打开一个客户端二,执行 set name zhangsan
命令:
然后再回到客户端一执行 exec
命令。这时候会发现直接返回了 nil
,也就是事务中所有的命令都没有被执行(即:只要检测到一个 key
值被修改过,那么整个事务都不会被执行):
watch 原理分析
下面是一个 Redis
服务的数据结构定义:
typedef struct redisDb {
dict *watched_keys; //被 watch 命令监视的 key
int id; //Database ID
//...省略了其他属性
} redisDb;
可以看到,redisDb
中的 watched_keys
存储了一个字典,这个字典当中的 key
存的就是被监视的 key
,然后字典的值存的就是客户端 id
。然后每个客户端还有一个标记属性 CLIENT_DIRTY_CAS
,一旦我们执行了一些如 set
,sadd
等能修改 key
值对应 value
的命令,那么客户端的 CLIENT_DIRTY_CAS
标记属性将会被修改,后面执行事务提交命令 exec
时发现客户端的标记属性被修改过(乐观锁的体现),则会拒绝执行事务。
总结
本文主要介绍了 Redis
当中的事务机制,在介绍事务实现原理的同时从传统关系型数据库的 ACID
四大特性对比分析了 Redis
当中的事务,并最终了解到了 Redis
的事务似乎并不是那么“完美”。