MongoDB的聚合筆記

銀河小船兒發表於2023-12-10

原文網址 : https://www.cnblogs.com/romantichuaner/p/17888861.html

MongoDB筆記

1，聚合

聚合(aggregate)主要用於計算資料，類似sql中的sum()、avg()。

常用的表示式如上圖。

1.1，aggregate 語法

語法： db.集合名稱.aggregate([{管道:{表示式}}])

常用的管道：

1.2，$match 和 $group

往集合 items 中先插入資料

db.items.insert(
[
{quantity:2,price:5.0,pnumber:"p003"},
{quantity:2,price:8.0,pnumber:"p002"},
{quantity:1,price:4.0,pnumber:"p002"},
{quantity:2,price:4.0,pnumber:"p001"},
{quantity:4,price:10.0,pnumber:"p003"},
{quantity:10,price:20.0,pnumber:"p001"},
{quantity:10,price:20.0,pnumber:"p003"},
{quantity:5,price:10.0,pnumber:"p002"}
]
)

檢視視覺化工具插入的結果如下：

例1：

查詢 pnumber:"p001" ，再來看語法：db.集合名稱.aggregate([{管道:{表示式}}])

db.items.aggregate([{"$match":{"pnumber":"p001"}}])

例2：

查詢price 大於8的 quantity ，以平均值 avg_quantity表示，並按 pnumber分組。所以分組欄位是 $pnumber，平均值avg_quantity，avg_quantity是新的欄位名，聚合運算子是 $avg。

db.items.aggregate([
   {"$match":{"price":{"$gt":8}}},
   {"$group":{"_id":"$pnumber","avg_quantity":{"$avg":"$quantity"}}}
])

例3：

查詢 price大於8的quantity，以平均值 avg_quantity 表示，並過濾出平均值大於5的avg_quantity。前半句話是上個例子的，過濾出是用 $match。

db.items.aggregate([
   {"$match":{"price":{"$gt":8}}},
   {"$group":{"_id":"$pnumber","avg_quantity":{"$avg":"$quantity"}}},
   {"$match":{"avg_quantity":{"$gt":5}}}
])

例4：

按 pnumber分組

db.items.aggregate([
      {"$group":{"_id":"$pnumber"}}   
])

按 quantity 和 price 分組

db.items.aggregate([
      {"$group":{"_id":{"quantity":"$quantity","price":"$price"}}}   
])

截了部分屏

1.3，聚合運算子（$sum，$avg，$max，$min，$first，$last）

例1（$max)：

按 pnumber 分組，並求出每組 price的最大值max_price

db.items.aggregate([
      {"$group":
          {"_id":"$pnumber",
           "max_price":{"$max":"$price"}
           }
       }   
])

例2（$min）：

按 pnumber分組，並求出每組 price 的最大值 max_price，最小值 min_price

db.items.aggregate([
      {"$group":
          {"_id":"$pnumber",
           "max_price":{"$max":"$price"},
           "min_price":{"$min":"$price"}
           }
       }   
])

這個把上面寫的 $max，$min一替換就行。

例3（$sum）：

按pnumber分組，並計算每組的 quantity的總和 count，並按count升序排。這裡用了 $sort，注意要在分組完才能 $sort（看好格式）。

db.items.aggregate([
      {"$group":
          {"_id":"$pnumber","count":{"$sum":"$quantity"}},
       },
       {"$sort":{"count": 1}}   
])

例4：

查詢分組後每個 pnumber 出現的次數，並按升序排

db.items.aggregate([
      {"$group":
          {"_id":"$pnumber","count":{"$sum":1}},
       },
       {"$sort":{"count": 1}}   
])

例5（$addToSet，$push）：

按 pnumber 分組，並查出各 pnumber內的price ，price可以重複（用 $push）

db.items.aggregate([
      {"$group":
               {"_id":"$pnumber","prices":{"$push":"$price"}}             
       }
])

結果是因為新增的資料不太好，所以看不出有沒有重複還是重複了。

按 pnumber 分組，並查出各 pnumber內的price ，price不可以重複（用 $addToSet）

db.items.aggregate([
      {"$group":
               {"_id":"$pnumber","prices":{"$addToSet":"$price"}}             
       }
])

1.4，投射（$project），$add

只保留 _id 和 pnumber，新增 new_price，new_price 就是讓 price加1（用到了 $add）

db.items.aggregate([
      {
          $project:{
              "_id":1,
              "pnumber":1,
              "new_price":{"$add":["$price", 1]}
                    }
       }
])

1.5，排序（$sort），限制（$limit），跳過（$skip）

例1：

取平均價格最貴的前兩個pnumber，所以是按pnumber分組（$group），再降序排（$sort），再限制是前兩個（$limit）。

db.items.aggregate([
    {
        "$group":{"_id":"$pnumber","平均價格":{"$avg":"$price"}}   
    },
    {
        "$sort":{"平均價格": -1}
    },
    {
        "$limit": 2
    }  
])

例2：

取平均價格最貴的第二個 pnumber，就是在上個例子的基礎上，跳過1個， $skip：1

db.items.aggregate([
    {
        "$group":{"_id":"$pnumber","平均價格":{"$avg":"$price"}}   
    },
    {
        "$sort":{"平均價格": -1}
    },
    {
        "$limit": 2
    },
    {
        "$skip":1
    }  
])

1.6，隨機獲取，$sample

db.items.aggregate([
     {$sample: {size: 3}}
])

再點執行，就出來不一樣的結果

1.7，擷取（$substr），拼接（$concat），轉小寫（$toLower），轉大寫（$toUpper）

例1：

把 pnumber 的下標為 0到2 位置的截出來，_id 隱藏

db.items.aggregate([
    {
      $project:{
         "_id":0,
         "str": {$substr: ["$pnumber", 0, 2]}
                }  
    }

])

因為擷取是左閉右開的截，所以顯示是兩個字元。

例2：

把 pnumber 欄位下的內容和 "測試" 拼接起來

db.items.aggregate([
    {
      "$project":{
         "_id":0,
         "str": {"$concat": ["$pnumber", "測試"]}
                }  
    }
])

例3：

將pnumber的英文轉換為大寫

db.items.aggregate([
     {
         "$project":{"pnumber":{"$toUpper":"$pnumber"}}
     }
])

mongodb聚合操作記錄
2020-10-09
MongoDB
mongodb 聚合管道
2018-09-24
MongoDB
MongoDB - 聚合查詢
2022-11-24
MongoDB
MongoDB學習筆記
2018-07-02
MongoDB筆記
MongoDB 學習筆記
2022-05-22
MongoDB筆記
es筆記七之聚合操作之桶聚合和矩陣聚合
2023-11-17
筆記矩陣
es筆記六之聚合操作之指標聚合
2023-11-12
筆記指標
【MongoDB學習筆記】MongoDB 快速入門
2021-12-21
MongoDB筆記
MongoDB系列--深入理解MongoDB聚合（Aggregation ）
2019-07-30
MongoDB
【MongoDB學習筆記】MongoDB索引那點事
2022-01-05
MongoDB筆記索引
ES 筆記十五：聚合分析簡介
2019-10-30
筆記
ES 筆記三十九：Pipeline 聚合分析
2019-12-30
筆記
Django筆記十六之aggregate聚合操作
2023-04-05
Django筆記
ES 筆記三十八：Bucket & Metric 聚合分析及巢狀聚合
2019-12-28
筆記巢狀
005.MongoDB索引及聚合
2019-06-05
MongoDB索引
MongoDB學習之聚合操作
2021-12-02
MongoDB
mongoDB資料庫之聚合
2020-11-28
MongoDB資料庫
ES 筆記四十：聚合的作用範圍及排序
2020-01-02
筆記排序
【MongoDB學習筆記】-使用 MongoDB 進行 CRUD 操作（下）
2021-12-22
MongoDB筆記
【MongoDB學習筆記】-使用 MongoDB 進行 CRUD 操作（上）
2021-12-21
MongoDB筆記
MYSQL學習筆記7: 聚合函式
2024-03-08
MySql筆記函式
.NET 雲原生架構師訓練營（模組二基礎鞏固 MongoDB 聚合）--學習筆記
2021-01-04
架構MongoDB筆記
ElasticSearch學習筆記(二)——對聚合的簡單理解
2018-06-17
Elasticsearch筆記
ClickHouse原始碼筆記1:聚合函式的實現
2020-06-02
原始碼筆記函式
ClickHouse原始碼筆記2:聚合流程的實現
2020-07-17
原始碼筆記
Node學習筆記 Mongodb 和 Mongoose
2020-11-30
筆記MongoDB
【MongoDB學習筆記】手把手教你配置Python操作MongoDB
2021-12-23
MongoDB筆記Python
ES 筆記四十一：聚合的精準度問題
2020-01-03
筆記
mongoDB中聚合函式java處理
2019-04-14
MongoDB函式Java
MongoDB三種聚合命令用法介紹
2018-07-19
MongoDB
快速掌握mongoDB(二)——聚合管道和MapReduce
2019-07-18
MongoDB
JAVA - mongodb 聚合幾種查詢方式
2018-03-26
JavaMongoDB
MongoDB 學習筆記之常用 shell 命令
2019-12-27
MongoDB筆記
ClickHouse原始碼筆記5:聚合函式的原始碼再梳理
2021-04-20
原始碼筆記函式
基於docker 初學 MongoDb 學習筆記
2021-05-01
DockerMongoDB筆記
MongoDB 聚合嵌入的陣列（扁平化資料+管道）
2018-06-24
MongoDB陣列
ES[7.6.x]學習筆記（十）聚合查詢
2020-05-26
筆記
MongoDB 記錄
2024-04-11
MongoDB