MongoDb 快速翻頁方法

  • 2019 年 10 月 3 日
  • 筆記

翻閱數據是MongoDB最常見的操作之一。一個典型的場景是需要在你的用戶介面中顯示你的結果。如果你是批量處理的數據,同樣重要的是要讓你的分頁策略正確,以便你的數據處理可以規模化。

接下來,讓我們通過一個例子來看在MongoDB中翻閱數據的不同方式。在這個例子中,我們有一個CRM資料庫的用戶數據,我們需要通過翻閱瀏覽和在同一時間顯示10個用戶。所以實際上,我們的頁面大小是10。下方是我們的用戶文檔的結構:

1
2
3
4
5
6
7
8
9
10
11
{
 
  _id,
 
  name,
 
  company,
 
  state
 
}

方法一:Using skip() 和 limit()

MongoDB本身支援分頁操作使用 skip() 和 limit() 指令。skip(n)指令告訴MongoDB,它應該跳過“n”結果和limit(n)指令指示MongoDB,它應該限制結果長度為“n”結果。通常情況下,你將使用 skip() 和 limit() 指令,但為了說明情況,我們提供了控制台命令,這樣也能達到相同的結果。同時,為了程式碼比較簡潔,限制檢查程式碼被排除在外。

1
2
3
4
5
6
7
8
9
10
11
12
13
//Page 1
 
db.users.find().limit (10)
 
//Page 2
 
db.users.find().skip(10).limit(10)
 
//Page 3
 
db.users.find().skip(20).limit(10)
 
........

一般來說,檢索頁面n,程式碼是這樣的:

db.users.find().skip(pagesize*(n-1)).limit(pagesize)
然而,隨著數據的大小增加,這種方法出現嚴重的性能問題。其原因是在每次執行查詢時,建立了完整的結果集,那麼伺服器必須從收集的開始走到指定的偏移量。當偏移量增加時,這一過程會變得越來越慢。同時,這個過程沒有有效地使用索引。所以,當你有較小的數據集時,典型的“skip() ”和“ limit() ”的方法是有用的。如果您正在使用大數據集,您需要考慮其他方法。

方法二:Using find() 和limit()

以前的方法不能很好擴展其原因是skip() 命令。因此,本節的目標是實現分頁不使用skip()命令。為此,我們將利用在存儲數據中的自然順序,比如時間戳或文檔中存儲的標識。

在這個例子中,我們將使用“_id”存儲每個文檔。“_id”是一個MongoDB 的ObjectID結構,即 12 位元組結構包含了時間戳、機械加工、進程標識符、計數器等。總體思路如下 :

檢索當前頁中的最後一個文檔 _id
在下一個頁面檢索文件大於此”_id”

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
//Page 1
 
db.users.find().limit(pageSize);
 
//Find the id of the last document in this page
 
last_id = ...
 
//Page 2
 
users = db.users.find({'_id'> last_id}). limit(10);
 
//Update the last id with the id of the last document in this page
 
last_id = ...

這種方法利用內在的規則存在_id欄位。也因為“_id”欄位是默認的查找操作,它是非常好的性能指標。如果你使用的欄位沒有被索引,那麼你在操作中會受到困擾,所以確保欄位被索引是非常重要的。

同樣,如果你希望數據按照特定順序進行排序分頁的話,那麼你還可以使用sort()條款與上述技術。重要的是要確保排序過程是利用索引來獲得最佳性能。您可以使用.explain()後綴來查詢。

1
2
3
4
5
users = db.users.find({'_id'> last_id}). sort(..).limit(10);
 
//Update the last id with the id of the last document in this page
 
last_id = ...

以上就是MongoDB快速翻頁的方法,希望能給大家一個參考,也希望大家多多支援腳本之家。