亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定

Hadoop進階

mooc小牧 JAVA開發工程師
難度中級
時長 3小時 3分
學習人數
綜合評分9.77
31人評價 查看評價
9.9 內容實用
9.5 簡潔易懂
9.9 邏輯清晰
  • 一個Map Reduce作業要有Mapper類、Reduce類、主方法類

    查看全部
  • Hadoop分布式緩存:

    加載到內存發生在Job執行之前,每個從節點各自都緩存一份相同的共享數據,如過共享數據太大,可以將共享數據分批緩存,重復執行作業。

    查看全部
  • Reduce任務數量:

    在大數據量的情況下,如果只設置1個Reduce任務,那么在Reduce階段,整個集群只有該節點在運行Reduce任務,其他節點都將被閑置,效率十分低下。故建議將Reduce任務數量設置成一個較大的值(最大值是72)。

    查看全部
  • 本地優化——Combine:

    數據經過Map端輸入后會進行網絡混寫,經過Shuffle后進入Reduce,在大數據量的情況下可能會造成巨大的網絡開銷。故可以在本地先按照key先行一輪排序與合并,再進行網絡混洗,這個過程就是Combine。

    查看全部
  • 控制Map任務的個數:

    1、增加map個數,可增大mapred.map.tasks

    2、減少map個數,可增大mapred.min.split.size

    如果要減少map個數,但有很多小文件,可將小文件合并成大文件,再使用準則2

    查看全部
  • 節點Map任務的個數:

    在實際情況下,map任務的個數是受多個條件的制約,一般一個DataNode的map任務數量控制在10到100比較合適。

    查看全部
  • Word Count實例回顧:

    1、Input(輸入文件)

    2、Split階段(分片輸入階段),將數據以<Key,Value>的形式輸入到Map階段

    3、Map階段。得到的每一行數據都會被拆分,將原始Value拆分,重新組成新的<Key,Value>,其中新的Key為原始的Value,新的Value為該數據出現一次,最終將所有新數據輸入到Shuffle階段

    4、Shuffle階段。該階段比較復雜,簡單解釋就是將從Map得到的<Key,Value>新數據重新歸類,將所有相同的Key重新歸到一起,但是Value只進行歸類不進行次數統計,將最后數據同樣以<Key,Value>的形式輸入到Reduce階段

    5、Reduce階段。接收到Shuffle階段傳來的數據,將數據進行處理,對每一個Value進行求和處理,最后重新生成輸出結果。

    查看全部
  • Shuffle階段:

    Shuffle階段過程比較復雜,可以理解為從Map輸出到Reduce輸入的過程,而且涉及到網絡傳輸

    查看全部
  • Map Reduce的四個階段:

    1、Split階段(分片輸入階段)

    2、Map階段(需要編碼)

    3、Shuffle階段

    4、Reduce階段(需要編碼)

    查看全部
  • Map Reduce作業是一種大規模數據集的并行計算的編程模型。我們可以將HDFS中存放的海量(TB級以上)數據,通過Map Reduce作業進行計算,得到目標數據!

    查看全部
  • HDFS是Hadoop分布式文件系統的簡稱,由若干臺計算機組成,用于存放PB、TB數量級以上的文件,每份文件可以有多個副本,多以HDFS是一個具有高冗余、高容錯的文件系統。

    查看全部
    0 采集 收起 來源:hadoop體系架構

    2019-02-11

  • 在一個datanode中進行分片split

    每個split對應一個map task

    查看全部
  • split->map->“reduce(本地)”->網絡混洗shuffle->reduce

    查看全部
  • 合并小文件策略
    查看全部
  • map任務個數

    查看全部

舉報

0/150
提交
取消
課程須知
1、在學習本課程之前,需要學習hadoop課程基礎篇,即掌握MapReduce作業的基本步驟。 2、需要掌握線性代數、向量等的基本數學知識
老師告訴你能學到什么?
1、hadoop新舊版本的基本架構 2、mapreduce作業的內部原理 3、mapreduce作業重要參數的調優 4、利用hadoop緩存實現矩陣相乘 5、簡單的推薦算法

微信掃碼,參與3人拼團

微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號

友情提示:

您好,此課程屬于遷移課程,您已購買該課程,無需重復購買,感謝您對慕課網的支持!