已解決430363個問題，去搜搜看，總會有你想問的

MapReduce是單線程的，性能很差？是這樣的嗎？

關注

首頁猿問 MapReduce是單線程的，性能...

MapReduce是單線程的，性能很差？是這樣的嗎？

MongoDB

SMILET 2023-04-18 19:15:36

聽說mongodb的MapReduce是單線程的，性能很差，這是怎么回事？差到什么程度呢？？有哪位大俠能說說原理。

查看完整描述

2 回答

犯罪嫌疑人X

TA貢獻2080條經驗獲得超4個贊

里面執行是否是單線程我不知道，但是，如果是生產環境的話，最好還是別每次直接去訪問mapReduce 的結果，根據數據量的大小，還是會花費一定的時間的。我們的數據是千萬級別，每次執行mapReduce，大概需要5-6秒時間，還好我們的應用不是對實時性很高。所以基本上是緩存2個小時的數據，然后在去執行mapReduce 獲取最新的結果。

反對回復 2023-04-21

慕娘9325324

TA貢獻1783條經驗獲得超4個贊

之前使用MapReduce做過類似的事情，因為耗時，后來修改成使用聚合查詢做統計，具體示例如下：

> db.user.findOne()
{    "_id" : ObjectId("557a53e1e4b020633455b898"),    "accountId" : "55546fc8e4b0d8376000b858",    "tags" : [        "金牌會員",        "鉆石會員",        "鉑金會員",        "高級會員"
    ]
}

基本的文檔model如上，我在accountId和tags上做了索引

db.user.ensureIndex({"accountId":1, "tags":1})

現在要求統計用戶下面的tags，MapReduce設計如下：

var mapFunction = function() {   if(this.tags){       for (var idx = 0; idx < this.tags.length; idx++) {           var tag = this.tags[idx];
           emit(tag, 1);
       }
   }
};var reduceFunction = function(key, values) {    var cnt=0;   
    values.forEach(function(val){ cnt+=val;});  
    return cnt;
};


db.user.mapReduce(mapFunction,reduceFunction,{out:"mr1"})    //輸出到集合mr1中

結果：

> db.mr1.find().pretty()
{ "_id" : "金牌會員", "value" : 9000 }
{ "_id" : "鉆石會員", "value" : 43000 }
{ "_id" : "鉑金會員", "value" : 90000 }
{ "_id" : "銅牌會員", "value" : 3000 }
{ "_id" : "銀牌會員", "value" : 5000 }
{ "_id" : "高級會員", "value" : 50000 }

看似達到我們的效果, 我只是拿少量的數據10W做的上面的測試, 執行的過程中,它會輸出:

> db.mapReduceTest.mapReduce(mapFunction,reduceFunction,{out:"mr1"}){    "result" : "mr1",    "timeMillis" : 815,                   //耗時多久
    "counts" : {        "input" : 110000,             //掃描的文檔數量
        "emit" : 200000,              //mongo執行計算的次數
        "reduce" : 2001,        "output" : 6
    },    "ok" : 1}

因為我mock的數據比較簡單有規律，可以看出它的計算次數幾乎是掃描的文檔數量的二倍，后來使用隨機的數據做測試，發現結果更糟糕，果斷放棄MapReduce的實現，改用其他實現。

反對回復 2023-04-21

2 回答
0 關注
277 瀏覽

關注

添加回答

舉報

0/150

提交

取消

亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

熱搜

最近搜索清空

MapReduce是單線程的，性能很差？是這樣的嗎？

MapReduce是單線程的，性能很差？是這樣的嗎？

2 回答

添加回答

MapReduce是單線程的，性能很差？是這樣的嗎？

MapReduce是單線程的，性能很差？是這樣的嗎？