国产一区二区三区成熟 ,狠狠干天天日综合

首頁免費課 Hadoop基礎及演練筆記

Hadoop基礎及演練

                
                叁金
            JAVA開發工程師

                    查看講師更多課程 
                    叁金講師的其他課程
                
玩轉熱門框架 用企業級思維 開發通用夠硬的大數據平臺
實戰·中級·482

                                                                                                                                    ￥448.00
                                            
多層次構建企業級大數據平臺， 成就全能型大數據開發
實戰·高級·149

                                                                                                                                    ￥499.00
                                            
ChatGPT入門實戰課 AI提效大數據開發平臺建設
實戰·初級·252

                                                                                                                                    ￥168.00
                                            
Calcite數據管理與SQL優化實戰
初級·1235
免費課程
                                
Presto實戰與演練
中級·3876
免費課程
                                
                難度初級
            
                時長 1小時 6分
            
                學習人數
            
綜合評分9.30
                            51人評價
                        查看評價
                                9.4
                                內容實用
                            
                                9.1
                                簡潔易懂
                            
                                9.4
                                邏輯清晰

最熱最新

若雪夕顏 00:47

Hadoop生態圈

查看全部

0 采集收起來源：Hadoop生態圈簡介
2018-04-24
基督山公爵 02:36

Spark優勢
基于內存計算的分布式計算框架
抽象出分布式內存存儲數據結構彈性分布式數據集RDD
基于事件驅動，通過線程池復用線程提高性能

查看全部

0 采集收起來源：Spark簡介
2018-04-23
基督山公爵 01:30

Spark簡介
Spark是Apache軟件基金會最重要的三大分布式計算系統開源項目之一（其他的是Hadoop和Maven）
基于內存計算的大數據并行計算框架
Spark是MapReduce的替代方案，兼容HDFS，HIVE等數據源

查看全部

0 采集收起來源：Spark簡介
2018-04-23
基督山公爵 01:46

HBase的表
可以實現存儲海量小文件的功能

查看全部

0 采集收起來源：HBase簡介
2018-04-23
基督山公爵 01:21

HBase關鍵字
RowKey：數據唯一標識，按字典排序
Column Family：列族，多個列的集合，最多不要超過3個
TimeStamp時間戳：支持多版本數據同時存在

查看全部

0 采集收起來源：HBase簡介
2018-04-23
基督山公爵 00:51

HBase簡介
高可靠，高性能，面向列，可伸縮，實時讀寫的分布式數據庫
利用HDFS作為其文件儲存系統，支持MapReduce程序讀取數據
存儲非機構化和半結構化數據以及結構化數據

查看全部

0 采集收起來源：HBase簡介
2018-04-23
基督山公爵 01:02

Hadoop生態圈

查看全部

0 采集收起來源：Hadoop生態圈簡介
2018-04-23
基督山公爵 02:49

Deep thinking

查看全部

0 采集收起來源：Hadoop總結及延伸思考
2018-04-23
基督山公爵 01:34

Conclusion

查看全部

0 采集收起來源：Hadoop總結及延伸思考
2018-04-23
基督山公爵 08:59

Reduce

查看全部

0 采集收起來源：MapReduce實戰
2018-04-23
基督山公爵 05:29

Map

查看全部

0 采集收起來源：MapReduce實戰
2018-04-23
基督山公爵 01:38

YARN（Haoop2之后的資源管理器）概念
? ? ? 1.ResourceManager：分配和調度資源；啟動并監控ApplicationMaster; 監控NodeManager
? ? ? 2.ApplicatonMaster：為MR類型的程序申請資源，并分配給內部任務；負責數據的切分；監控任務的執行及容錯；
? ? ? 3.NodeManager：管理單個節點的資源；處理來自ResourceManager的命令；處理來自ApplicationMaster的命令
? ? ?MapReduce是一種編程模型，是一種編程方法，是抽象的理論；
MapReduce編程模型
? ? ? 輸入一個大文件，通過Split之后，將其分為多個分片；每個文件分片由單獨的機器去處理，這就是Map方法 ?；將各個機器計算的結果進行匯總并得到最終的結果，這就是Reduce方法。

查看全部

0 采集收起來源：Mapreduce和Yarn簡介
2018-04-23
基督山公爵

兩個問題：?
1，數據塊一般設置多大比較合適？?
128M,因為如果設置太大不利于文件的讀取，設置太小會將一些比較小的文件也會被進行分割，比較耗費內存?
2，nameNode掛掉了怎么辦？在Hadoop2中會有容錯機制，會有兩個nameNode，另一個會處于備用的狀態，當nameNode掛掉了之后，secondNameNode會被啟動的，這樣是用戶無感知的

查看全部

0 采集收起來源：Shell命令操作HDFS
2018-04-23
基督山公爵 01:11

hdfs的一些常用命令：
一些與Linux命令相同：ls cat vi 等?
還有一些是hdfs專用的命令： copyToLocal hdfs文件系統向本地拷貝?
copyFromLocal ?從本地向hdfs文件系統拷貝?
get 下載文件 put 上傳文件?
./hdfs dfs -help 可以查看hdfs命令的說明

查看全部

0 采集收起來源：Shell命令操作HDFS
2018-04-23
基督山公爵 04:07
HDFS讀流程
1. 客戶端向NameNode發起讀數據請求；
2. NameNode找出距離最近的DataNode節點信息；
3. 客戶端從DataNode分塊下載文件；
查看全部

0 采集收起來源：HDFS寫流程和讀流程
2018-04-23

首頁上一頁 25 26 27 28 29 30 31 下一頁尾頁

舉報

0/150

提交

取消

開始學習

課程須知: 有Linux命令使用基礎，有Python編程基礎

老師告訴你能學到什么？: 大數據到底是個啥，大數據方向到底怎么樣 Hadoop基礎原理與兩個核心 Hadoop的基礎應用 Hadoop生態圈簡介 Hadoop生態圈常用開源項目介紹

微信掃碼，參與3人拼團

亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

熱搜

最近搜索清空

Hadoop基礎及演練