亚洲欧美伊人五月天,中日韩一区二区三区高清

首頁免費課 Hadoop基礎及演練筆記

Hadoop基礎及演練

                
                叁金
            JAVA開發工程師

                    查看講師更多課程 
                    叁金講師的其他課程
                
玩轉熱門框架 用企業級思維 開發通用夠硬的大數據平臺
實戰·中級·482

                                                                                                                                    ￥448.00
                                            
多層次構建企業級大數據平臺， 成就全能型大數據開發
實戰·高級·149

                                                                                                                                    ￥499.00
                                            
ChatGPT入門實戰課 AI提效大數據開發平臺建設
實戰·初級·252

                                                                                                                                    ￥168.00
                                            
Calcite數據管理與SQL優化實戰
初級·1235
免費課程
                                
Presto實戰與演練
中級·3876
免費課程
                                
                難度初級
            
                時長 1小時 6分
            
                學習人數
            
綜合評分9.30
                            51人評價
                        查看評價
                                9.4
                                內容實用
                            
                                9.1
                                簡潔易懂
                            
                                9.4
                                邏輯清晰

最熱最新

基督山公爵 03:30

Hadoop是一個開源的大數據框架；
Hadoop是分布式計算的解決方案；
Hadoop = HDFS(分布式文件系統) （存儲）+ MapReduce(分布式計算)
HDFS總結：
? ? ?普通的成百上千臺機器；TB甚至PB為單位的大量的數據；簡單便捷的文件獲取；
HDFS概念：
? ?1.數據塊?
? ? ? ? ?數據塊是抽象塊，而非整個文件作為存儲單元；默認大小為64M，一般設置128M，備份3個；
? ?2.NameNode
? ? ? ? ?管理文件系統的命名空間，存放文件元數據；維護著文件系統的所有文件和目錄，文件與數據塊的映射；記錄每個文件中各個塊所在數據節點的信息；
? ?3.DataNode
? ? ? ? 存儲并檢索數據塊；向NameNode更新所存儲塊的列表；
HDFS優點：
? ? ?適合大文件存儲，支持TB、PB級別的數據存儲，并有副本策略；可以構建在廉價的機器上，并有一定的容錯和恢復機制；支持流式數據訪問，一次寫入，多次讀取最高效；
HDFS缺點：
? ? 不支持大量小文件的存儲；不適合并發寫入，不支持文件隨機修改；不支持隨機讀等低延時的訪問方式；

查看全部

0 采集收起來源：HDFS概念及優缺點
2018-04-23
血色萬花筒

什么是大數據？
大數據即使一個概念也是一門技術，是在以Hadoop為代表的大數據平臺框架上進行各種數據分析的技術。
大數據包括了以Hadoop和spark為代表的基礎大數據框架。還包括實時數據處理，離線數據處理；數據分析，數據挖掘和用機器算法進行預測分析等技術

查看全部

0 采集收起來源：大數據方向介紹
2018-04-19
血色萬花筒

什么是大數據？
大數據是一個概念也是一門技術，是在以Hadoop為代表的大數據平臺框架上進行各種數據分析的技術

查看全部

0 采集收起來源：大數據方向介紹
2018-04-19
挖坑埋你

1

查看全部

0 采集收起來源：大數據方向介紹
2018-04-19
慕的地522374

hdfs3

查看全部

0 采集收起來源：Python程序操作HDFS
2018-04-17
慕的地522374

Spark簡介
Spark優勢

查看全部

0 采集收起來源：Spark簡介
2018-04-17
慕的地522374

HBase簡介
簡單介紹

查看全部

0 采集收起來源：HBase簡介
2018-04-17
慕的地522374 00:49

Hadoop生態圈

查看全部

0 采集收起來源：Hadoop生態圈簡介
2018-04-17
慕的地522374

問題

查看全部

0 采集收起來源：Hadoop總結及延伸思考
2018-04-17
慕的地522374 05:37

map方法
reduce方法
測試
在進行Reduce方法時進行了sort（排序）
提交到Hadoop框架上
查詢
打印結果

查看全部

0 采集收起來源：MapReduce實戰
2018-04-17
每天進步一小點點 05:55

NameNode

查看全部

0 采集收起來源：HDFS概念及優缺點
2018-04-16
慕的地4735554

hdfs 塊儲存

查看全部

0 采集收起來源：HDFS概念及優缺點
2018-04-16
慕的地522374

YARN（Haoop2之后的資源管理器）概念
? ? ? 1.ResourceManager：分配和調度資源；啟動并監控ApplicationMaster; 監控NodeManager
? ? ? 2.ApplicatonMaster：為MR類型的程序申請資源，并分配給內部任務；負責數據的切分；監控任務的執行及容錯；
? ? ? 3.NodeManager：管理單個節點的資源；處理來自ResourceManager的命令；處理來自ApplicationMaster的命令
? ? ?MapReduce是一種編程模型，是一種編程方法，是抽象的理論；
MapReduce編程模型
? ? ? 輸入一個大文件，通過Split之后，將其分為多個分片；每個文件分片由單獨的機器去處理，這就是Map方法 ?；將各個機器計算的結果進行匯總并得到最終的結果，這就是Reduce方法；

查看全部

1 采集收起來源：Mapreduce和Yarn簡介
2018-04-17
慕的地522374 00:31

查看全部

0 采集收起來源：Shell命令操作HDFS
2018-04-14
慕的地522374
HDFS讀流程
1. 客戶端向NameNode發起讀數據請求；
2. NameNode找出距離最近的DataNode節點信息；
3. 客戶端從DataNode分塊下載文件；
查看全部

0 采集收起來源：HDFS寫流程和讀流程
2018-04-14