MongoDB的一些高級語法

  • 2019 年 10 月 3 日
  • 筆記
 

 

 

MongoDB的一些高級語法

在前面的部落格中,我們了解一些Mongodb中最基礎的用法,只介紹了簡單的增刪查改,在這篇部落格中,我將介紹一下稍微複雜一點的語法。

AND 和 OR操作

AND操作

在前面的部落格中,我們介紹了查找命令,其中可以指令多個查詢條件,當所有條件都符合時,就可以查詢到數據。那麼,如果我們只想只要有一個條件符合,就返回想要的數據,那麼我們應該怎麼做呢?

db.getCollection('test_data_1').find({"欄位1":"固定值1","欄位2":"固定值2"})

在上面的命令中,實際上是一個隱式的AND,因為需要同時滿足。但是又沒有出現AND這個關鍵詞,所以被稱為“隱式AND操作”。下面,就讓我們來將隱式轉為顯式,只需要使用“$and”即可。

db.getCollection('test_data_1').find(      {      	"$and":[          	{"欄位1":"固定值1"},          	{"欄位2":"固定值2"}      	]      }  )

OR操作

or操作就是為了查詢只符合其中任一條件的數據。命令語法和顯式的AND操作一樣。

db.getCollection('test_data_1').find(      {      	"$or":[          	{"欄位1":"固定值1"},          	{"欄位2":"固定值2"}      	]      }  )

其中,我們需要知道,儘管存在隱式的AND操作,但是,對於OR操作來說,不存在隱式的OR操作。 同時or操作時會遵循一個”短路原則”:只要前面的條件滿足了,那後面的條件直接跳過(類似編程中的||)。

嵌入式文檔

下面便是一個嵌入式文檔的例子:

我們可以看到在studyInfo中,還有著score和project。其中,studyInfo被稱為嵌入式文檔,studyInfo下面的欄位被稱為嵌套欄位

 

 

 

插入

下面是一個插入語句的示例。

db.getCollection('test_data_1').insertOne(  {      "age":18,      "adress":"Hunan",      "studyInfo":{          "score":59,          "project":"LOL"          }      }  )

查詢

查詢語句

如果我們需要根據嵌入式文檔中的嵌套欄位的條件去查詢,那麼下面這樣使用就行了。如果嵌套欄位裡面還有嵌入式文檔,一路點點點過去就行了。

db.getCollection('test_data_1').find(      {      	"studyInfo.score":59      },        // 不返回studyInfo.score      {      	"studyInfo.score":0      }  )

數組(Array)欄位

插入

在下面中,like欄位保存的就是一個數組,所以我們使用**[]**將”apple”,”orange”,”fruit”括起來。

db.getCollection('test_data_1').insertOne(  {      "name":"Array",      "like":["apple","orange","fruit"]  }  )	

使用Robo3T可視化工具查看,顯示如下:

 

1566638722008

1566638722008

 

查詢

其中,like的類型為Array。但是如果我們查詢的時候需要根據like中某個值作為篩選目標的時候,我們怎麼辦呢?我們無需進行其他任何操作(和以前的查詢一模一樣)。例如查詢所有喜歡orange的人:

db.getCollection('test_data_1').find({"like":"orange"})

也就是說它的查詢與以前沒有任何區別。但是,既然是數組,總有一定其他的操作,例如查詢欄位數組為長度的記錄:

db.getCollection('test_data_1').find({"like":{"$size":3}})

上面是查詢like欄位的數組長度為3的記錄。

注意:“$size”只能查詢某一個具體長度的數組,而不能查詢範圍,如果進行範圍查詢的話,會報錯:

 

 

 

當然,既然有數組,那麼必然會有索引,在mongodb中,數組的第一個元素的索引為0,和大部分的編程的情況是一樣的。

我們可以通過“欄位名.索引”來定位元素。例如查詢:

db.getCollection('test_data_1').find(      {         "like.0":"apple"          }  )

聚合(Aggregation)

聚合的功能很簡單,就是讓Mongodb來處理數據,然後返回被處理好的數據。

聚合的操作命令是“aggregation”,基本格式是:

db.getCollection('test_data_1').aggregation([階段1,階段2,階段3……])

集中,階段可以為零個(那麼就相當於findi命令),也可以為任意數量。其中,階段中間有點類似linux或者unix中的管道

 

img

img

 

也就是說,前面一個階段的輸出,是後面一個結點的輸入。

下面是來自菜鳥教程的一些關鍵字的用法。

  • $project:修改輸入文檔的結構。可以用來重命名、增加或刪除域,也可以用於創建計算結果以及嵌套文檔。
  • $match:用於過濾數據,只輸出符合條件的文檔。$match使用MongoDB的標準查詢操作。
  • $limit:用來限制MongoDB聚合管道返回的文檔數。
  • $skip:在聚合管道中跳過指定數量的文檔,並返回餘下的文檔。
  • $unwind:將文檔中的某一個數組類型欄位拆分成多條,每條包含數組中的一個值。
  • $group:將集合中的文檔分組,可用於統計結果。
  • $sort:將輸入文檔排序後輸出。
  • $geoNear:輸出接近某一地理位置的有序文檔。

下面我將在一些數據的處理方面來介紹一下其中的一些命令。

篩選數據

篩選數據的功能乍一看和find的功能差不多,然後仔細一看,還真的和find的功能一模一樣。篩選數據的關鍵字是“ $match”

db.getCollection('test_data_1').aggregate([{"$match":{和find完全一樣的過濾表達式}}])

下面是返回like欄位數組的第一個元素為“apple”的記錄(和上面數組欄位裡面查詢返回的結果一模一樣)。

db.getCollection('test_data_1').aggregate([{"$match":{"like.0":"apple"}}])

那麼,這樣做有什麼意義呢?返回的結果和find的命令一樣,還比find麻煩,這樣做豈不是多此一舉。的確,如果我們僅僅這樣做,還不如使用find,它的強大之處在於與其他關鍵字進行組合。因為進行數據處理,一般第一步都是進行篩選。

修改欄位

前面我們介紹了$project的介紹,那麼修改欄位我們將使用$projecto來操作。

$project:修改輸入文檔的結構。可以用來重命名、增加或刪除域,也可以用於創建計算結果以及嵌套文檔。

正如上面所介紹的,$project的功能很強大,可以做到很多事情。

  1. 修改返回的欄位

    下面返回的欄位中不包含_id和like 欄位

    db.getCollection('test_data_1').aggregate([      {"$project":{"_id":0,"like":0}}  ])

    下面是結合$match的使用,其中前面的$match的返回的輸出是$project的輸入

    db.getCollection('test_data_1').aggregate([      {"$match":{"like":{"$size":3}}},      {"$project":{"_id":0,"like":0}}  ])

    這個的作用也和find中的返回返回部分欄位的操作差不多,這個操作沒有什麼讓人新奇的地方,下面將介紹它的其他強大之處。

    注意事項

    包括現有欄位

    • _id 欄位默認包含在輸出文檔中。
    • 如果指定包含文檔中不存在的欄位, $project 將忽略該欄位包含,並且不會將該欄位添加到文檔中。

    取消_id欄位

    • 默認情況下, _id 欄位包含在輸出文檔中。要從輸出文檔中排除 _id 欄位,必須在 $project 中明確指定對 _id 欄位的抑制。

    排除欄位

    • 如果指定排除某個或多個欄位,則在輸出文檔中返回所有其他欄位。

    • 如果指定排除 _id 以外的欄位,則不能使用任何其他 $project 規範表單:即,如果排除欄位,則不能指定包含欄位,重置現有欄位的值或添加新欄位。

  2. 添加新的欄位

    如果我想返回的結果中添加新的欄位,怎麼辦?在project中直接添加就行

    db.getCollection('test_data_1').aggregate([        {"$project":{          "name":1,          "_id":0,     		// 添加的新的欄位          "add":"GG"          }       }  ])

    不過值得注意的是:

    如果指定排除 _id 以外的欄位,則不能使用任何其他 $project 規範表單:即,如果排除欄位,則不能指定包含欄位,重置現有欄位的值或添加新欄位。

    也就是說,如果排除了除“_id”以外的欄位,那麼,就GG了。就沒辦法添加欄位了。

     

     

     

    並且值得注意的是,添加新的欄位的時候,如果舊的欄位不設置為1,則不會返回。(也就是說,如果添加了新的欄位,想要返回本來存在欄位,必須將欄位設置為1)

     

     

     

  3. 重命名欄位

    重命名欄位和添加新的欄位差不多,簡單點來說,我們可以使用“$舊的欄位名”來表示欄位的數據。示例如下

    db.getCollection('test_data_1').aggregate([        {"$project":{      	// 添加新的欄位,新的欄位的數據是name欄位的數據          "add":"$name"          }       }  ])

    結果如下:

     

     

     

    這個對於嵌套文檔有著非常好的效果,可以看下面的兩個例子

    使用find 使用聚合

     

     

  4. 處理特殊字元

    這裡有說兩個問題,如果我需要修改一個欄位的數據為1,或者為$project呢?可以知道,這些值與mongodbe自身的語法衝突了(所有以“$”開頭的普通字元串和數字都不能添加)。這個時候我們可以使用” $literal”關鍵字。

     

     

     

分組操作

分組操作所對應的關鍵字是“$group”,它的作用是根據給出的欄位key,它所有的key的值相同的記錄放在一起進行運算。

去重

在上一篇部落格中使用了去重函數“distinct”,使用該函數後,返回的是一個數組。不過,現在我們可以使用“$group”去重。操作如下所示:

db.getCollection('test_data_1').aggregate(      [          {              "$group":{"_id":"$被g去重的欄位名"}          }      ]  )

其中,“_id”是必不可少的,不能用其他的去替代。而這個返回的也不是一個數組,而是很多條記錄。

 

 

 

分組操作運算

首先先說一下運算的關鍵字,關鍵字包括(來自菜鳥教程):

表達式 描述 實例
$sum 計算總和。 db.mycol.aggregate([{$group : {_id : “$by_user”, num_tutorial : {$sum : “$likes”}}}])
$avg 計算平均值 db.mycol.aggregate([{$group : {_id : “$by_user”, num_tutorial : {$avg : “$likes”}}}])
$min 獲取集合中所有文檔對應值得最小值。 db.mycol.aggregate([{$group : {_id : “$by_user”, num_tutorial : {$min : “$likes”}}}])
$max 獲取集合中所有文檔對應值得最大值。 db.mycol.aggregate([{$group : {_id : “$by_user”, num_tutorial : {$max : “$likes”}}}])
$push 在結果文檔中插入值到一個數組中。 db.mycol.aggregate([{$group : {_id : “$by_user”, url : {$push: “$url”}}}])
$addToSet 在結果文檔中插入值到一個數組中,但不創建副本。 db.mycol.aggregate([{$group : {_id : “$by_user”, url : {$addToSet : “$url”}}}])
$first 根據資源文檔的排序獲取第一個文檔數據。 db.mycol.aggregate([{$group : {_id : “$by_user”, first_url : {$first : “$url”}}}])
$last 根據資源文檔的排序獲取最後一個文檔數據 db.mycol.aggregate([{$group : {_id : “$by_user”, last_url : {$last : “$url”}}}])

大家看那個實例估計也明白怎麼操作了。首先我們先去重,然後再指定名字,最後進行計算:

計算的方法:{$關鍵字:$已有的欄位名}

下面便是計算age的平均值,然後以“aver_age”返回。

 

 

 

原則上,“$sum”和“$avg”的值對應的值應該是數字,如果使用非數字,則“$sum”會返回0,“$avg”會返回“null”。注意,字元串是可以比較大小的。其中,“$sum”的值還可以使用數字“1”,例如"count":{"$sum":1},則返回的就是每個分組有多少條記錄。

拆分數組

拆分數組使用的關鍵字是“$unwind”,它的作用是把一條包含數組的記錄拆分為很對條記錄,其中,每一條記錄擁有數組中的一個元素。

下面是數組like和infos進行拆分,其中拆分的結果數量是like數組的長度乘以infos數組的長度。

db.getCollection('test_data_1').aggregate(      [          {"$unwind":"$like"},          {"$unwind":"$infos"},      ]  )

 

 

 

聯集合查詢

Mongodb中的聯集合查詢類似SQL中的聯表查詢,在聯集合查詢中,有兩個概念,主集合被查集合。簡單點來說,就是主集合提供欄位key,然後被查集合通過欄位key查出需要的欄位。

db.getCollection('主集合名').aggregate([      "$lookup":{              "from":"被查集合名",              "localField":"主集合提供的欄位key",              "foreginField":"被查集合接受的欄位",              "as":"為查出來的欄位命名",      }  ]  )

下面是兩個文檔,一個為user,一個為login

現在我們通過login中的id從user中拿出欄位:

db.getCollection('login').aggregate([     { "$lookup":{              "from":"user",              "localField":"loginId",              "foreignField":"id",              "as":"login_name",          }     }  ]  )

返回結果如下:

 

 

 

其中,login_name為聯結合查出來的數據,為一個數組。

當然,對於這個結果的樣式我們是不太滿意的,因為我我們只想拿出name,這個時候我們就需要使用前面的知識來解決這個問題了。

db.getCollection('login').aggregate([     { "$lookup":{              "from":"user",              "localField":"loginId",              "foreignField":"id",              "as":"login_name",          }     },   {         "$unwind":"$login_name"     },     {         "$project":{             "_id":0,             "loginId":1,             "name":"$login_name.name"               }     }  ])

返回的結果如圖所示:

 

 

 

參考資料

參考書籍:《左手Mongodb,右手Redis》

菜鳥教程:https://www.runoob.com/mongodb/mongodb-tutorial.html

docs4dev:https://www.docs4dev.com/docs/zh/mongodb/v3.6/reference