redis 主從複製詳解

2021 年 9 月 12 日
筆記
Redis

引言

我們之前操作 Redis 都是單機版，但是實際應用中沒人使用單機版，都是搭建集群的方式。這篇文章要介紹的主從複製，是指將一台 Redis 伺服器的數據，複製到其他 Redis 伺服器，我們將前者稱為主節點 master，將後者稱為從節點 slave（replica）。在這個過程中，數據的複製是單向的，即只能從主節點到從節點。並且從節點只能讀數據，不能寫數據，實現讀寫分離。

一個主節點可以有多個從節點，一個從節點只能有一個主節點。所有的伺服器默認都是主節點。
從節點下面還可以有從節點，形成一個圖的結構

主從複製的優點

數據冗餘：主從複製實現了數據的熱備份，是持久化之外的一種數據冗餘方式。
故障恢復：當主節點出現問題時，可以由從節點提供服務，實現快速的故障恢復；實際上是一種服務的冗餘。
負載均衡：在主從複製的基礎上，配合讀寫分離，寫數據時應用連接主節點，讀數據時應用連接從節點，分擔伺服器負載；尤其是在寫少讀多的場景下，通過多個從節點分擔讀負載，可以大大提高 Redis 伺服器的並發量。
高可用基礎：主從複製是哨兵模式和集群能夠實施的基礎。

開啟主從複製

主從複製的前提就是多個 Redis 伺服器，因此要多個配置文件。

開啟主從複製的方式有兩種：

配置配置文件

從伺服器配置master節點

# 主節點ip port
# replicaof <masterip> <masterport>
# 主節點的認證密碼(可選)
# masterauth <master-password>

顯示命令開啟

客戶端使用該命令slaveof [ip] [port]

INFO REPLLICATION命令可查看節點資訊

主從複製的具體實現

主從複製的實現可以分為三個階段：建立連接、數據同步、命令傳播

1. 建立連接

發送 slaveof 非同步命令
建立 socket 連接

連接成功後從節點會為該 socket 建立一個專門處理複製工作的文件事件處理器，負責後續的複製工作，如接收 RDB 文件、接收命令傳播等；
發送 ping 命令

從節點成為主節點的客戶端之後，發送 ping 命令進行首次請求，目的是檢查 socket 連接是否可用，以及主節點當前是否能夠處理請求。
身份驗證

取決於從節點是否設置 masterauth 選項，而這個又取決於主節點是否設置 requirepass
發送從節點埠資訊

2. 數據同步

連接建立完成後，要進行主從資料庫的數據同步，這一步也可以看作從節點中數據的初始化。數據同步有舊版和新版兩種。我們先來看看舊版 Redis 怎麼實現數據同步的

舊版同步

舊版同步使用的命令是 sync，同步方式是全量複製。以下是sync命令的執行步驟：

從伺服器向主伺服器發送 sync 命令
主伺服器收到後執行 BGSAVE 的rgb持久化命令，生成一個RDB文件。並用一個緩衝區記錄生成rgb文件期間執行的所有寫命令。
主伺服器將 rgb 文件發送給從伺服器，從伺服器載入整個 rgb 文件，同步資料庫狀態至執行 BGSAVE 時主服務的狀態
主伺服器將記錄在緩衝區的寫命令發送給從伺服器。至此從服務和主服務資料庫狀態達到一致。

舊版同步功能的缺陷：

斷線後重連需要再次發送 sync 同步命令，主服務再次生成 rgb 文件，從伺服器載入恢復資料庫狀態。簡單來說就是斷線後又要全量複製，但其實沒有必要，我們只需要同步斷線後到重新連接期間主伺服器變化的數據即可。

並且，sync是一個非常耗費資源的操作，因此舊版同步是非常低效的。

新版同步

新版同步使用的命令是 psync ，同步方式是增量複製

psync 有完成重同步和部分重同步兩種模式。完整重同步其實就是sync，主要用於處理初次服務的情況。部分重同步主要用於處理斷線後重連的情況。部分重同步不需要重新生成、傳送和載入整個rdb文件，只需要將從伺服器缺少的寫命令發送給從伺服器執行即可。完美的解決了舊版同步效率低下的問題。

下面我們就來看看他是如何實現的？首先要了解幾個概念

主節點和從節點的複製偏移量

主節點和從節點會各自維護一個複製偏移量 ( offset )，代表的是主節點向從節點傳遞的位元組數。主節點每次向從節點傳播 N 個位元組數據時，主節點的 offset 增加 N；同理，當從節點每次收到主節點傳來的 N 個位元組數據時，從節點的 offset 增加 N。通過比較主節點和從節點的 offset 可以判斷資料庫狀態是否一致，如果兩者的 offset 相同，則一致，否則不一致；也可以根據兩者的 offset 找出從節點缺少的數據。
主節點的複製積壓緩衝區
主節點維護的一個固定長度的先進先出 ( FIFO) 隊列，默認大小是 1MB。當主節點開始有從節點時，主節點創建複製積壓緩衝區，其作用是備份主節點最近發送給從節點的數據。保存的數據有兩方面：
- 最近傳播的寫命令。為什麼最近呢？因為隊列長度固定，老的命令會被新的取代
- 隊列中每個位元組對應的複製偏移量
當從伺服器重新連接上主機時，會通過 psync 命令把自己的offset發給主節點
- 如果offset之後的數據全部在隊列中，執行部分重同步（增量複製）
- 如果offset之後的數據不全在隊列中，執行完整重同步（全量複製）
伺服器的運行ID

每個redis伺服器都有自己的運行ID，在啟動時自動生成，由40個隨機的十六進位字元組成

當從節點對主節點進行初次複製時，主節點會把自己的運行ID發給從節點，從節點保存並在斷線重連上主節點時把次ID發送給主節點：
- 如果此ID和主節點當前連接的ID一致，說明是同一個狀態，可以進行增量複製
- 如果不同，只能進行全量複製

總結：psync的執行流程：

命令傳播

數據同步階段完成後，主從節點進入命令傳播階段；在這個階段主節點將自己執行的寫命令發送給從節點，從節點接收命令並執行，從而保證主從節點數據的一致性。

這個階段沒啥可說的，就是把主節點執行的寫命令發給從節點，讓它們也執行一次，保證主從一致性

心跳檢測

在命令傳播階段，從伺服器默認會以每秒一次的頻率向主伺服器發送replconf ACK <replication_offset>,其中replication_offset是它當前的複製偏移量。心跳檢測的目的有以下三個：

檢測主從伺服器的網路連接狀態

如果主伺服器超過一秒沒有收到從服務的該命令，那麼主伺服器就知道主從連接出現問題了
輔助實現min-slaves

主服務我們可以配置以下兩個參數來防止不安全寫命令傳播，如果從節點小於3或者lag大於10，主伺服器都會拒絕執行寫命令
```
# 從節點的最小個數
# min-replicas-to-write 3
# 從節點lag的最大值
# min-replicas-max-lag 10
```
檢測命令丟失

上面說過心跳檢測命令還發送了從節點自身保存的offset。主節點會與自己的 offset 進行對比，如果從節點數據缺失（如網路丟包），主節點會找到缺失的數據，並把這些數據重新推送給伺服器（這裡也會利用複製積壓緩衝區）。

參考

Tags: Redis