如何用好redis pipeline

2019 年 11 月 5 日
筆記

编者注：pipeline是Redis的一个提高吞吐量的机制，适用于多key读写场景，比如同时读取多个key的value，或者更新多个key的value。工作过程中发现挺多小伙伴都对pipeline多少有些了解，但是更深入的理解或者说有哪些坑就不知道了，下面咱们就一起分析下redis pipeline机制，揭开它的神秘面纱。

Redis本身是基于Request/Response协议（停等机制）的，正常情况下，客户端发送一个命令，等待Redis返回结果，Redis接收到命令，处理后响应。在这种情况下，如果同时需要执行大量的命令，那就是等待上一条命令应答后再执行，这中间不仅仅多了RTT（Round Time Trip），而且还频繁调用系统IO，发送网络请求。为了提升效率，这时候pipeline出现了，它允许客户端可以一次发送多条命令，而不等待上一条命令执行的结果，这和网络的Nagel算法有点像（TCP_NODELAY选项）。pipeline不仅减少了RTT，同时也减少了IO调用次数（IO调用涉及到用户态到内核态之间的切换）。

要支持Pipeline，其实既要服务端的支持，也要客户端支持。对于服务端来说，所需要的是能够处理一个客户端通过同一个TCP连接发来的多个命令，可以理解为，这里将多个命令切分，和处理单个命令一样（之前老生常谈的黏包现象），Redis就是这样处理的。而客户端，则是要将多个命令缓存起来，缓冲区满了或者达到发送条件就发送出去，最后才处理Redis的应答。

注意：Redis的Pipeline和Transaction（Redis事务）不同，Transaction会存储客户端的命令，最后一次性执行，而Pipeline则是处理一条(批次)，响应一条，从二者的不同处理机制来看，Redis事务中命令的执行是原子的（注意，其中一部分命令出现错误后续命令会继续执行，这里的原子说的是命令执行是完整的，中间不会被其他Redis命令所打断），而pipeline中命令的执行不一定是原子的。但是这里却有一点不同，就是pipeline机制中，客户端并不会调用read去读取socket里面的缓冲数据（除非已经发完pipeline中所有命令），这也就造成了，如果Redis应答的数据填满了该接收缓冲（SO_RECVBUF），那么客户端会通过ACK，WIN=0（接收窗口）来控制服务端不能再发送数据，那样子，数据就会缓冲在Redis的客户端应答缓冲区里面。所以需要注意控制Pipeline的大小。如下图：

这里可以设想一下，如果客户端通过ACK，WIN=0（接收窗口）来控制服务端不能再发送数据，那么数据就会堆积在服务端socket发送缓冲区中，如果服务端socket发送缓冲区也满了，那么此时服务端调用write(socket)就会阻塞或者失败。

既然提到了tcp/ip的滑动窗口概念，这里就简单总结下滑动窗口：

滑动窗口在TCP中的作用是提供TCP的可靠性和流控特性，滑动窗口可分为发送窗口和接收窗口，它们分别对应于发送缓冲区和接收缓冲区。发送窗口的大小是根据客户端接收缓冲区的大小而设定的（三次握手的目的是连接服务器指定端口，建立 TCP 连接，并同步连接双方的序列号和确认号，交换 TCP 窗口大小信息）。

发送窗口中包含的内容是已发送但还未收到Ack的数据和未发送但对端允许发送的数据。

TCP接收缓冲区中包含应用为读取数据、已接收数据(已回复ACK)、待接收，其中待接收空间可称为接收窗口。

使用pipeline过程中，要注意控制一次pipeline中的命令总大小，不能使响应结果撑爆socket接收缓冲区。这里我们思考一个问题，还有没有其他方式提高pipeline的处理性能呢？理论上是有的，比如可以使用数据压缩机制，进一步减小数据传输的总大小，不过这需要客户端和服务端提供解压缩机制，同时会耗费一定量服务器CPU。

欢迎小伙伴关注【TopCoder】阅读更多精彩好文。

如何用好redis pipeline

VirMach 便宜 VPS

QNews

如何用好redis pipeline

分享此文：

Related Posts

spring-boot-route（二十二）实现邮件发送功能

ClickHouse(01)什么是ClickHouse,ClickHouse适用于什么场景

匹马行天下之思维决定高度篇——道道道，学习Java之道

你对区块链的理解还停留在炒币上吗

VirMach 便宜 VPS

QNews

熱門文章

熱門搜尋