-
RDD彈性分布式數據集
查看全部 -
利用HDFS作為文件系統,MR程序讀取數據,可存儲非結構化和半結構化數據,也可存儲結構化數據。對于海量的小數據可以用Hbase
?ROWKey Colum Family
查看全部 -
HBase 分布式數據庫
查看全部 -
延伸思考?
查看全部 -
Mapreduce 分而治之
查看全部 -
數據塊一般設置為128M,設置太小的話對于Namenode的內存消耗會比價嚴重,namenode存儲了整個集群的數據快的信息,數據塊設置太大,對并行支持就不太好了
Hadoop2有兩個namenode節點,一個是主節點另一個為備用節點處于standby狀態,兩個節點數據時刻保持一致。一旦主節點掛掉,備用節點立馬啟用
查看全部 -
Shell訪問HDFS hdfs dfs -cat指定目錄文件 通過python訪問HDFS HDFS3:python一個模塊 實例化后是一個訪問HDFS的一個客戶端查看全部
-
PETHON查看全部
-
Hadoop是什么
????1.Hadoop是一個開源的大數據框架
? ? 2.Hadoop是一個分布式計算的解決方案
????3.Hadoop=HDFS(分布式文件系統)+MapReduce(分布式計算)
Hadoop核心
????HDFS分布式文件系統:存儲是大數據技術的基礎
????MapReduce:分布式計算是大數據應用的解決方案
查看全部 -
課程預備知識
查看全部 -
課程的目標
查看全部 -
大數據方向
查看全部 -
什么是大數據
查看全部 -
2-4Python 未學習查看全部
-
HDFS的概念
?????????數據塊
?????????NameNode
???????? DataNode
查看全部
舉報