mongodb 數據塊的遷移流程介紹

1. 基本概念

1.1 Chunk(數據塊)

表示特定服務器上面,連續範圍的分片鍵值所包含的一組數據,是一個邏輯概念。

例如,某數據塊記錄如下:

{
    "_id" : "chunk-a",  // 數據塊Id
    "ns" : "user.address",  // 該數據塊對應的數據庫名和表名
    "min" : {               // 該數據塊對應的分片鍵值的起始值(包含),是「Shi Jiazhuang」
        "city" : "Shi Jiazhuang"
    },
    "max" : {               // 該數據塊對應的分片鍵值的結束值(不包含),是「Nanjjing」
        "city" : "Nan Jing"
    },
    "shard" : "repa"        // 該數據塊存儲在repa分片服務器               
}
// 即該數據塊記錄表示,數據庫user中的表address中的「city」字段中,其值從「Shi Jiazhuang」(包含)到「Nan Jing」(不包含)這段連續區間的數據,都存儲在名為repa的分片服務器。

 

1.2 Chunk Size(數據塊大小)

數據塊所對應的數據,如果超過64M(默認值),則會被系統自動切分為兩個數據,即數據塊會從1塊切分為2塊,圖示如下:

 

1.3 Migration(數據塊遷移)

mongodb有一個後台的平衡器進程,它會監控各個分片服務器上面的數據塊的數量,如果發現不同的分片服務器上面數據塊的數量差異,超過閾值,則會啟動數據塊遷移任務,

直至不同的分片服務器之間的數據塊的數量差異落在閾值之內,圖示如下:

 

1.4 Migration Thresholds(遷移閾值)

數據塊的遷移閾值,是和該表的數據塊總數相關的,具體如下:

數據塊總數量 閾值
小於20 2
20-79 4
大於等於80 8

 

 

 

2. 遷移流程

數據塊的遷移對於用戶和應用層來說是透明的,當然可能會有些性能的損失,整個遷移流程有7個步驟,圖示如下

 

各個步驟的內容如下:

1. 平衡器發送遷移命令給源節點。

2. 源節點啟動了一個內部的數據塊遷移命令給目標節點,同時在數據塊遷移期間,對於該數據塊的請求依然路由到源節點。

3. 目標節點首先創建該數據塊上缺失的索引(如果需要的話)。

4. 目標節點到源節點拉取數據。

5. 目標節點需要到源節點再請求在步驟4執行期間的增量變更數據(新增、更新和刪掉),如果有則跳轉到步驟4,直到沒有增量數據。

6. 數據全部遷移成功後,源節點會向配置服務器(config server)發送請求,更新該數據塊的元數據中的”分片服務器(shard)”的值為目標節點。

7. 源節點刪除本地的該數據塊對應的數據。

3. 最佳實踐

以上分享了數據塊和數據塊遷移的一些基本概念和流程,下面是一些最佳實踐。

3.1 關於數據塊大小的選擇

數據塊的大小,默認是64M,通常情況下是不需要修改它的,但是有時候該值的大小根據不同的業務場景會帶來不同的影響,需要綜合多方面的因素來設置該值。

數據塊大小太小:通常情況下,較小的數據塊大小,會帶來更頻繁的數據塊遷移,數據在集群間的分佈會更加均衡,但是如果分片鍵設置的不夠合理,則會產生很多無法切分(split)的大數據塊,太大的數據塊無法在分片之間遷移,從而導致數據分佈的不均衡性,此時需要把數據塊大小調大。

數據塊大小太大:較大的數據塊,意味着更少的數據塊遷移,數據在集群間的分佈容易出現不平衡,同時也容易產生讀寫熱點(可手動切分),此時需要把數據塊大小調小。

3.2 關於數據塊遷移對集群性能的影響

數據塊遷移除了佔用目標節點和源節點的帶寬和磁盤讀寫資源外,在遷移流程中的步驟6會短暫阻塞對該數據塊的訪問,影響應用的訪問,因此建議設置平衡器的活躍時間窗口,設置為業務低估時進行,步驟如下:

1. 連接到mongos。

2. 切換到config數據庫

use config

3. 啟動平衡器

如果平衡器是關閉狀態,則設置活躍時間窗口也是不會做數據遷移的,命令如下:

sh.startBalancer()

4. 修改活躍時間窗口

db.settings.updateOne(
   { _id: "balancer" },
   { $set: { activeWindow : { start : "01:00", stop : "06:00" } } },  // start和stop的格式為"HH:MM",其中HH的取值範圍是0到23,MM的取值範圍是00到59
   { upsert: true }
)