《閑扯Redis十》Redis 跳躍表的結構實現

2020 年 8 月 11 日
筆記
Redis

一、前言

Redis 提供了5種數據類型：String（字元串）、Hash（哈希）、List（列表）、Set（集合）、Zset（有序集合），理解每種數據類型的特點對於redis的開發和運維非常重要。

備註： 按照分析順序，本節應該說道有序集合對象了，但是考慮到有序集合對象的底層實現中使用到了跳躍表結構，避免在分析有序集合時造成突兀，所以本節先來看看 redis 中跳躍表結構的具體實現。

二、結構解析

Redis 的跳躍表由 redis.h/zskiplistNode 和 redis.h/zskiplist 兩個結構定義，其中 zskiplistNode 結構用於表示跳躍表節點，而 zskiplist 結構則用於保存跳躍表節點的相關資訊，比如節點的數量，以及指向表頭節點和表尾節點的指針等。

圖 5-1 展示了一個跳躍表示例，位於圖片最左邊的是 zskiplist 結構，該結構包含以下屬性：

header ：指向跳躍表的表頭節點。
tail ：指向跳躍表的表尾節點。
level ：記錄目前跳躍表內，層數最大的那個節點的層數（表頭節點的層數不計算在內）。
length ：記錄跳躍表的長度，也即是，跳躍表目前包含節點的數量（表頭節點不計算在內）。

zskiplist 結構右邊的是四個 zskiplistNode 結構，該結構包含以下屬性：

層（level）：節點中用 L1 、 L2 、 L3 等字樣標記節點的各個層， L1 代表第一層， L2 代表第二層，以此類推。每個層都帶有兩個屬性：前進指針和跨度。前進指針用於訪問位於表尾方向的其他節點，而跨度則記錄了前進指針所指向節點和當前節點的距離。在上面的圖片中，連線上帶有數字的箭頭就代表>前進指針，而那個數字就是跨度。當程式從表頭向表尾進行遍歷時，訪問會沿著層的前進指針進行。

後退指針（backward）：節點中用 BW 字樣標記節點的後退指針，它指向位於當前節點的前一個節點。後退指針在程式從表尾向表頭遍歷時使用。

分值（score）：各個節點中的 1.0 、 2.0 和 3.0 是節點所保存的分值。在跳躍表中，節點按各自所保存的分值從小到大排列。

成員對象（obj）：各個節點中的 o1 、 o2 和 o3 是節點所保存的成員對象。
注意表頭節點和其他節點的構造是一樣的：表頭節點也有後退指針、分值和成員對象，不過表頭節點的這些屬性都不會被用到，所以圖中省略了這些部分，只顯示了表頭節點的各個層。

1.跳躍表節點結構

跳躍表節點實現由 redis.h/zskiplistNode 結構定義：

typedef struct zskiplistNode {

    // 後退指針
    struct zskiplistNode *backward;

    // 分值
    double score;

    // 成員對象
    robj *obj;

    // 層
    struct zskiplistLevel {

        // 前進指針
        struct zskiplistNode *forward;

        // 跨度
        unsigned int span;

    } level[];

} zskiplistNode;

層的定義

跳躍表節點的 level 數組可以包含多個元素，每個元素都包含一個指向其他節點的指針，程式可以通過這些層來加快訪問其他節點的速度，一般來說，層的數量越多，訪問其他節點的速度就越快。

每次創建一個新跳躍表節點的時候，程式都根據冪次定律（power law，越大的數出現的概率越小）隨機生成一個介於 1 和 32 之間的值作為 level 數組的大小，這個大小就是層的「高度」。

圖 5-2 分別展示了三個高度為 1 層、3 層和 5 層的節點，因為 C 語言的數組索引總是從 0 開始的，所以節點的第一層是 level[0] ，而第二層是 level[1] ，以此類推。

前進指針

每個層都有一個指向表尾方向的前進指針（level[i].forward 屬性），用於從表頭向表尾方向訪問節點。

圖 5-3 用虛線表示出了程式從表頭向表尾方向，遍歷跳躍表中所有節點的路徑：

迭代程式首先訪問跳躍表的第一個節點（表頭），然後從第四層的前進指針移動到表中的第二個節點。
在第二個節點時，程式沿著第二層的前進指針移動到表中的第三個節點。
在第三個節點時，程式同樣沿著第二層的前進指針移動到表中的第四個節點。
當程式再次沿著第四個節點的前進指針移動時，它碰到一個NULL，程式知道這時已經到達了跳躍表的表尾，於是結束這次遍歷。

層的跨度

層的跨度（level[i].span 屬性）用於記錄兩個節點之間的距離：

兩個節點之間的跨度越大，它們相距得就越遠。
指向 NULL 的所有前進指針的跨度都為 0 ，因為它們沒有連向任何節點。
初看上去，很容易以為跨度和遍歷操作有關，但實際上並不是這樣，遍歷操作只使用前進指針就可以完成了，跨度實際上是用來計算排位（rank）的：在查找某個節點的過程中，將沿途訪問過的所有層的跨度累計起來，得到的結果就是目標節點在跳躍表中的排位。

例如，圖 5-4 用虛線標記了在跳躍表中查找分值為 3.0 、成員對象為 o3 的節點時，沿途經歷的層：查找的過程只經過了一個層，並且層的跨度為 3 ，所以目標節點在跳躍表中的排位為 3 。

例如，圖 5-5 用虛線標記了在跳躍表中查找分值為 2.0 、成員對象為 o2 的節點時，沿途經歷的層：在查找節點的過程中，程式經過了兩個跨度為 1 的節點，因此可以計算出，目標節點在跳躍表中的排位為 2 。

後退指針

節點的後退指針（backward 屬性）用於從表尾向表頭方向訪問節點：跟可以一次跳過多個節點的前進指針不同，因為每個節點只有一個後退指針，所以每次只能後退至前一個節點。

圖 5-6 用虛線展示了如果從表尾向表頭遍歷跳躍表中的所有節點：程式首先通過跳躍表的 tail 指針訪問表尾節點，然後通過後退指針訪問倒數第二個節點，之後再沿著後退指針訪問倒數第三個節點，再之後遇到指向 NULL 的後退指針，於是訪問結束。

分值與成員

節點的分值（score 屬性）是一個 double 類型的浮點數，跳躍表中的所有節點都按分值從小到大來排序。

節點的成員對象（obj 屬性）是一個指針，它指向一個字元串對象，而字元串對象則保存著一個 SDS （簡單動態字元串，前面分析過）值。

在同一個跳躍表中，各個節點保存的成員對象必須是唯一的，但是多個節點保存的分值卻可以是相同的：分值相同的節點將按照成員對象在字典序中的大小來進行排序，成員對象較小的節點會排在前面（靠近表頭的方向），而成員對象較大的節點則會排在後面（靠近表尾的方向）。

例如，在圖 5-7 所示的跳躍表中，三個跳躍表節點都保存了相同的分值 10086.0 ，但保存成員對象 o1 的節點卻排在保存成員對象 o2和 o3 的節點之前，而保存成員對象 o2 的節點又排在保存成員對象 o3 的節點之前，由此可見， o1 、 o2 、 o3 三個成員對象在字典中的排序為 o1 <= o2 <= o3 。

2.跳躍表結構

雖然僅靠多個跳躍表節點就可以組成一個跳躍表，如圖 5-8 所示。

但通過使用一個 zskiplist 結構來持有這些節點，程式可以更方便地對整個跳躍表進行處理，比如快速訪問跳躍表的表頭節點和表尾節點，又或者快速地獲取跳躍表節點的數量（也即是跳躍表的長度）等資訊，如圖 5-9 所示。

zskiplist 結構的定義如下：

typedef struct zskiplist {

    // 表頭節點和表尾節點
    struct zskiplistNode *header, *tail;

    // 表中節點的數量
    unsigned long length;

    // 表中層數最大的節點的層數
    int level;

} zskiplist;

如圖：

header 和 tail 指針分別指向跳躍表的表頭和表尾節點，通過這兩個指針，程式定位表頭節點和表尾節點的複雜度為 O(1) 。

通過使用 length 屬性來記錄節點的數量，程式可以在 O(1)複雜度內返回跳躍表的長度。level 屬性則用於在 O(1) 複雜度內獲取跳躍表中層高最大的那個節點的層數量，注意表頭節點的層高並不計算在內。

三、跳躍表API操作

以表格的形式列出了跳躍表的API操作，以及API的時間複雜度。

函數	作用	時間複雜度
zslCreate	創建一個新的跳躍表。	O(1)
zslFree	釋放給定跳躍表，以及表中包含的所有節點。	O(N) ， N 為跳躍表的長度。
zslInsert	將包含給定成員和分值的新節點添加到跳躍表中。	平均 O(log N) ，最壞 O(N) ， N 為跳躍表長度。
zslDelete	刪除跳躍表中包含給定成員和分值的節點。	平均 O(log N) ，最壞 O(N) ， N 為跳躍表長度。
zslGetRank	返回包含給定成員和分值的節點在跳躍表中的排位。	平均 O(log N) ，最壞 O(N) ， N 為跳躍表長度。
zslGetElementByRank	返回跳躍表在給定排位上的節點。	平均 O(log N) ，最壞 O(N) ， N 為跳躍表長度。
zslIsInRange	給定一個分值範圍（range），比如 0 到 15 ， 20 到 28，諸如此類，如果給定的分值範圍包含在跳躍表的分值範圍之內，那麼返回 1 ，否則返回 0 。	通過跳躍表的表頭節點和表尾節點，這個檢測可以用 O(1) 複雜度完成。
zslFirstInRange	給定一個分值範圍，返回跳躍表中第一個符合這個範圍的節點。	平均 O(log N) ，最壞 O(N) 。 N 為跳躍表長度。
zslLastInRange	給定一個分值範圍，返回跳躍表中最後一個符合這個範圍的節點。	平均 O(log N) ，最壞 O(N) 。 N 為跳躍表長度。
zslDeleteRangeByScore	給定一個分值範圍，刪除跳躍表中所有在這個範圍之內的節點。	O(N) ， N 為被刪除節點數量。
zslDeleteRangeByRank	給定一個排位範圍，刪除跳躍表中所有在這個範圍之內的節點。	O(N) ， N 為被刪除節點數量。

四、要點總結

（1）跳躍表是有序集合的底層實現之一，除此之外它在 Redis 中沒有其他應用。

（2）Redis 的跳躍表實現由 zskiplist 和 zskiplistNode 兩個結構組成，其中 zskiplist 用於保存跳躍表資訊（比如表頭節點、表尾節點、長度），而 zskiplistNode 則用於表示跳躍表節點。

（3）每個跳躍表節點的層高都是 1 至 32 之間的隨機數。

（4）在同一個跳躍表中，多個節點可以包含相同的分值，但每個節點的成員對象必須是唯一的。

（5）跳躍表中的節點按照分值大小進行排序，當分值相同時，節點按照成員對象的大小進行排序。

over

Tags: Redis

《閑扯Redis十》Redis 跳躍表的結構實現

一、前言