課程
/云計算&大數據
/大數據
/快速入門Hadoop3.0大數據處理
Map的局部聚合雖然是可選項,執行局部聚合與不執行局部聚合,對于全局數據的清洗到聚合的全流程來說,性能有影響嘛?
2019-12-26
源自:快速入門Hadoop3.0大數據處理 5-2
正在回答
提前進行map的局部聚合,會提高性能,因為聚合后map端通過shuffle發送到reduce端的數據就少了,對應的就減少了網絡傳輸的時間
舉報
快速入門Hadoop3.0數據處理,輕松邁入大數據領域
2 回答關于reduce變量共享問題
4 回答部署hadoop
1 回答中間數據存儲在map中,數據量大能能解決嗎?
3 回答關于啟動后的出現的服務數量
1 回答怎么安裝部署?
Copyright ? 2025 imooc.com All Rights Reserved | 京ICP備12003892號-11 京公網安備11010802030151號
購課補貼聯系客服咨詢優惠詳情
慕課網APP您的移動學習伙伴
掃描二維碼關注慕課網微信公眾號
2020-01-05
提前進行map的局部聚合,會提高性能,因為聚合后map端通過shuffle發送到reduce端的數據就少了,對應的就減少了網絡傳輸的時間