亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定

認識Hadoop--基礎篇

Kit_Ren Linux系統工程師
難度初級
時長 1小時22分
學習人數
綜合評分9.17
211人評價 查看評價
9.4 內容實用
9.1 簡潔易懂
9.0 邏輯清晰
  • HDFS設計架構: ? ? ? ? ? ??

    塊:文件以“塊”進行存儲,HDFS默認塊大小為64M ? ? ? ? ? ??

    namenode:是管理節點,存放文件元數據,包括文件與數據塊的映射表、數據塊與數據節點的映射表 ? ? ? ? ? ??

    datenode:工作節點,真正存儲數據塊 最終體系結構:由block、namenode、datanode、secondarynamenode、client組成

    查看全部
    0 采集 收起 來源:HDFS基本概念

    2019-03-14

  • 一.安裝jdk

    二.配置hadoop的配置文件

    ? ?1.mapred-site.xml 配置文件

    • ?mapred.job.tracker mapred 訪問路徑

    ? ? 2.core-site.xml 配置文件 需要修改的

    • hadoop.tmp.dir ?臨時工作目錄

    • dfs.name.dir 原數據目錄

    • fs.default.name 文件系統地址和端口號

    ? 3.hdfs-site.xml?

    • dfs.data.dir 存放文件塊的一個目錄

    4.hadoop-env.sh

    • 配置java_home的安裝路徑

    三.格式化format

    hadoop namenode -format

    四.啟動hadoop

    start-satrt-all.sh

    五.用命令jps查看進程

    • JpbTracker

    • Jps

    • SecondaryNameNode

    • NameNode

    • DataNode

    • TaskTracker




    查看全部
    1 采集 收起 來源:安裝小結

    2019-03-13

  • 下載軟件地址: wget https://archive.apache.org/dist/hadoop/common/hadoop-1.2.1/hadoop-1.2.1.tar.gz

    配置4個文件(三個xml文件,一個.sh文件)

    mapred-site.xml

    core-site.xml

    hadoop-env.sh

    hdfs-site.xml

    hadoop安裝及配置:

    ?1.下載hdoop按照包并進行解壓?

    2.配置hdoop-env.sh文件,目的是配置jdk,并在profile配置haddoop的安裝位置?

    3.配置core-site.xml文件:hdoop的核心文件,里面有關于hdoop的節點端口與主機端口?

    4.配置hdfs-site.xml文件:hdoop的文件存儲的基本信息與目錄

    ?5.配置mapred-site.xml文件:hadoop的計算節點的端口號


    查看全部
  • 設置環境變量?

    vim? /etc/profile

    export JAVA_HOME=/usr/lib/jvm/java-7-openjdk-amd64/

    export JRE_HOME=$JAVA_HOME/jre

    export CLASSPATH=$JAVA_HOME/lib:$JRE_HOME/lib:CLASSPATH

    export PATH=$JAVA_HOME/bin:$JRE_HOME/bin:$PATH


    查看全部
  • zookeeper(動物管理員)

    ?管理Hadoop節點狀態和Hadoop的配置,維護數據節點的一致性

    查看全部
  • hbase區別HDFS

    查看全部
  • Hadoop可以用來做什么?


    查看全部
  • Hadoop的組成


    查看全部
  • hadoop是什么

    開源的 分布式存儲+分布式計算平臺

    查看全部
  • MapReduce的容錯機制

    1. 重復執行:執行出錯之后會重復執行四次

    2. 推測執行,判斷taskTracker的運行狀態,適當進行替換和舍棄

    查看全部
  • MapReduce的作業執行過程

    查看全部
  • JobTracker的角色

    1. 作業調度

    2. 分配任務、監控任務的執行進度

    3. 監控taskTracker狀態

    TaskTracker的角色

    1. 執行任務

    2. 向JobTracker報告進度

    查看全部
  • MapReduce的核心思想就是分而治之,將一個大人物分成多個小任務,并行執行之后,在合并結果

    查看全部
    0 采集 收起 來源:MapReduce的原理

    2019-03-04

  • HDFS的存取命令

    存:hadoop?fs -put?a.txt?input

    ?。篐adoop?fs -get input/a.txt

    查看全部
    0 采集 收起 來源:HDFS使用

    2019-03-04

  • HDSF特點

    1. 數據肉欲,硬件容錯,做了多個備份

    2. 流式訪問數據,無法對數據進行更改,適合一次寫入,多次讀取

    3. 存儲大文件,不適合大量存儲小文件,以為NameNode比較占空間,小文件不劃算

    適用性和局限性

    • 適合數據的批量讀寫,吞吐量高,一次寫入,多次讀取

    • 不適合交互式應用,低延遲很難滿足,不支持并發寫入相同文件

    查看全部
    0 采集 收起 來源:HDFS特點

    2019-03-04

舉報

0/150
提交
取消
課程須知
本課程需要童鞋們提前掌握Linux的操作以及Java開發的相關知識。對相關內容不熟悉的童鞋,可以先去《Linux達人養成計劃Ⅰ》以及《Java入門第一季》進行修煉~~
老師告訴你能學到什么?
1、Google的大數據技術 2、Hadoop的架構設計 3、Hadoop的使用 4、Hadoop的配置與管理

微信掃碼,參與3人拼團

微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號

友情提示:

您好,此課程屬于遷移課程,您已購買該課程,無需重復購買,感謝您對慕課網的支持!