测试平台系列(63) 软删除之殇

大家好~我是米洛

这是一个完整的接口测试平台系列教程,希望能和大家一起学习,从0到1打造一个开源平台。

欢迎关注我的公众号测试开发坑货,获取最新文章教程!

回顾

上一节我们基本上搞定了数据构造器的增删改等操作,这一篇我们来讲讲软删除相关的内容。

什么是软删除

先声明一下,我没有查阅关于具体软删除的资料,大家有兴趣的可以自己去搜索下,我说的都是自己的理解

删除数据,一般来说我们是从数据库或其他存储介质里面删除数据,举个🌰栗子:

我们需要把数据表里面的用户A删除掉,那我们最常见的方式就是:

delete from user where name='A';

这个我理解的话,就是物理删除,删除了以后,我们的数据表里面不再有这条数据的信息,如果还需要这个用户,则需要重新insert一遍。

软删除又是什么呢?软删除也可以叫做逻辑删除,比如我们给User表定义一个字段: deleted_at(代表这条数据删除的时间),如果这个字段不为空,说明用户未被删除, 反之则说明用户已经被删除了。因为只是逻辑上的”删除”,并不是真正删掉了这条数据,所以又叫做逻辑删除。

软删除的优点

软删除对比物理删除的话,好处在哪呢?我认为有以下几个方面:

  • 数据未被真实删除,数据更可靠
  • 可以通过把删除的时间戳赋予给deleted_at,从而知道删除的时间,无形之中记录了用户的删除操作
  • 对于用户而言和物理删除没什么区别
  • 拥有天然的回收站功能

软删除的缺点

上面提到了软删除的好处,这里就来说说软删除让人又爱又恨的地方。

  • 查询数据更加复杂

    查询条件需要带入deleted_at is null,否则会查询出被删除的数据。

    除了这个以外,还有一个比较棘手的问题,且听我慢慢道来。

索引之殇

索引这块是一个比较棘手的问题,特别是当我们有唯一索引的时候,我们先来看一种场景。

  • 用户表

    我们的用户表里面有email字段,但email大家都懂的,是不可以重复的,所以我们需要给它加上唯一索引

场景一

来看第一种场景,我们为用户表创建了一条数据:

email  -> [email protected]
deleted_at -> null

我们这时候要删除这条数据,但因为软删除的原因我们会写这样的sql:

update user set deleted_at = now() where email='[email protected]';

你以为这就没事儿了吗?

接下来的事情就让人脑崩了,由于唯一索引email_uidx的存在,我没法再新插入一条[email protected]的数据了。

执行插入语句的时候,会报duplicate index的错误,相信大家也不少见。

那这个问题怎么解决呢?我们来看看场景二

试着解决一下

为了解决场景一的唯一索引问题,我们想到了联合索引,啥子叫联合唯一索引呢?就是多个字段同时相同的时候,数据才算重复,也就是触发duplicate index报错。

于是我们创建一个联合唯一索引:

ALTER TABLE user ADD UNIQUE INDEX(email, deleted_at);

这时候,我们再来看场景一:

  • 创建用户
[email protected]
deleted_at=null

接着,我们删除之,这时候它变成了:

[email protected]
deleted_at=2021-09-12 20:13:00

然后我们继续添加[email protected]的用户,发现可以添加了

你以为这就完事了?那我们再看看场景二:

场景二

这个比较简单,我们insert2条相同的数据:

insert into user (email, deleted_at) values ('[email protected]', null);

insert into user (email, deleted_at) values ('[email protected]', null);

好久没写sql,也不知道写的对不对,凑合看,大概是这么个意思。

这时候奇迹出现了,可以发现2条数据都插入成功了,也就是说,之前的email的唯一性得不到保证了。

这是为什么呢?


原来,当联合索引里面有字段为null的时候,联合索引会自动失效

那这个真的是非常难受,可谓是修复了一个bug又导致了另一个bug。

解决方案一

其实我们可以把deleted_at设置为和主键一样的自增id,每当被删除的时候就+1,恢复的时候也+1,默认为0,这样也不会因为默认为NULL而引发唯一索引失效。

解决方案二

我们可以把deleted_at设置为时间戳,默认为0(代表未删除),一般来说,手动操作删除操作时间戳肯定有细微变化,这样索引将不会生效,也就是不会影响到之前的数据。

但也有一个缺点: 如果一个数据被删除多次,数据库将存在许多相同的被删除的数据,当然一般人也不会做辣么无聊的事情。

class Model(Base):
    deleted_at = Column(BIGINT, nullable=False, default=0)

可以看到deleted_at如此定义,当有删除操作的时候,我们设置deleted_at = time.time()即可。

import time
model.deleted_at = time.time()

大家如果有更合适的方案,也欢迎一起探讨感激不尽!