課程
/云計算&大數據
/大數據
/Hadoop基礎及演練
個人覺得后者對降低寫的latency更友好吧
2018-01-23
源自:Hadoop基礎及演練 2-2
正在回答
?在向HDFS的寫操作中,不得不提一下“數據流管道”。數據流管道在Google實現他們的分布式文件系統(GFS)時就已引入,其目的是:在寫一份數據的多個副本時,可以充分利用集群中每一臺機器的帶寬,避免網絡瓶頸和高延時的連接,最小化推送所有數據的延時。? 其實這里我可能表述的不太準確,Client在保存數據的過程當中,將數據發送到第一個數據節點DateNode 1,然后在第一個DateNode節點在本地保存數據的同時,將數據推送到第二個數據節點DateNode 2,同理在第二個節點本地保存數據的同時,也會由第二個數據節點將數據同送給第三個數據節點DateNode 3。??這樣啊,每個節點都能承擔寫數據時的部分網絡流量,降低了客戶端發送多分數據時對網絡的沖擊
慕UI6419280
叁金 回復 慕UI6419280
慕仰2907144 回復 叁金
寫的話也是按照最近的dataNODE來進行存儲吧
客戶端要向HDFS寫數據,首先要跟namenode通信以確認可以寫文件并獲得接收文件block的datanode,然后,客戶端按順序將文件逐個block傳遞給相應datanode,并由接收到block的datanode負責向其他datanode復制block的副本,百度到的,老師的DataNode-2和DataNode-3應該是DataNode-1的副本
舉報
與大數據密不可分的Hadoop框架,你值得學習
1 回答關于HDFS的寫流程
1 回答如果寫流程出錯了,怎么處理
3 回答讀流程的疑問
1 回答為何hdfs不適合文件并發寫入?
2 回答關于視頻中讀流程所舉的例子有些疑問
Copyright ? 2025 imooc.com All Rights Reserved | 京ICP備12003892號-11 京公網安備11010802030151號
購課補貼聯系客服咨詢優惠詳情
慕課網APP您的移動學習伙伴
掃描二維碼關注慕課網微信公眾號
2018-01-27
?在向HDFS的寫操作中,不得不提一下“數據流管道”。數據流管道在Google實現他們的分布式文件系統(GFS)時就已引入,其目的是:在寫一份數據的多個副本時,可以充分利用集群中每一臺機器的帶寬,避免網絡瓶頸和高延時的連接,最小化推送所有數據的延時。? 其實這里我可能表述的不太準確,Client在保存數據的過程當中,將數據發送到第一個數據節點DateNode 1,然后在第一個DateNode節點在本地保存數據的同時,將數據推送到第二個數據節點DateNode 2,同理在第二個節點本地保存數據的同時,也會由第二個數據節點將數據同送給第三個數據節點DateNode 3。??這樣啊,每個節點都能承擔寫數據時的部分網絡流量,降低了客戶端發送多分數據時對網絡的沖擊
2018-02-04
寫的話也是按照最近的dataNODE來進行存儲吧
2018-01-26
客戶端要向HDFS寫數據,首先要跟namenode通信以確認可以寫文件并獲得接收文件block的datanode,然后,客戶端按順序將文件逐個block傳遞給相應datanode,并由接收到block的datanode負責向其他datanode復制block的副本,百度到的,老師的DataNode-2和DataNode-3應該是DataNode-1的副本