簡介:大數據時代已經到來,越來越多的行業面臨著大量數據需要存儲以及分析的挑戰。Hadoop,作為一個開源的分布式并行處理平臺,以其高擴展、高效率、高可靠等優點,得到越來越廣泛的應用。本課旨在培養學員理解Hadoop的架構設計以及掌握Hadoop的運用能力。
第1章 初識Hadoop
本章講述課程大綱,授課內容,授課目標、預備知識等等,介紹Hadoop的前世今生,功能與優勢
第2章 Hadoop安裝
本章通過案例的方式,介紹Hadoop的安裝過程,以及如何管理和配置Hadoop
第3章 Hadoop的核心-HDFS簡介
本章重點講解Hadoop的組成部分HDFS的體系結構、讀寫流程,系統特點和HDFS的使用。
第4章 Hadoop的核心-MapReduce原理與實現
本章介紹MapReduce的原理,MapReduce的運行流程,最后介紹一個經典的示例WordCount
第5章 開發Hadoop應用程序
本章介紹在Hadoop下開發應用程序,涉及多個典型應用,包括數據去重,數據排序和字符串查找。