-
[-p]、[-r]遞歸創建
查看全部 -
本地的schema是file,端口號默認是9000
查看全部 -
HDFS不適合存儲小文件
查看全部 -
要保證服務端配置文件和客戶端配置文件一樣即可
查看全部 -
不要重復格式化,如果因為格式化出問題,刪掉hadoop_repo再格式化一次
查看全部 -
數據清洗,數據計算,展示
查看全部 -
工作中CDH和HDP多
查看全部 -
大數據生態圈
查看全部 -
1.0:mapreduce還有資源管理的功能,沒有解耦合
2.0:增加yarn,專門實現資源管理
3.0:優化,hdfs中namenode主節點可以有兩個
查看全部 -
yarn架構分析
從節點(NodeManager)資源管理包含CPU和內存資源
查看全部 -
mapreduce架構分析
查看全部 -
hdfs架構分析
主節點最多可以有兩個
查看全部 -
三大核心組件
查看全部 -
分布式計算
查看全部 -
磁盤io從數據庫獲得數據,再通過網絡io將數據傳到計算程序,網絡io消耗時間,數據移動到計算程序,數據量大時慢。而將計算程序移動到數據節點時速度快,此時就是一個本地計算
查看全部
舉報
0/150
提交
取消