-
HDFS 寫流程
查看全部 -
HDFS 寫流程
查看全部 -
Spark簡介:
1、基于內存計算的大數據并行計算框架
2、Spark是Map Reduce的替代方案,兼容HDFS,HIVE等數據源
查看全部 -
HBase(Hadoop Database)
是一個分布式 NoSQL 列存儲數據庫;
利用 HDFS 作為其文件存儲系統,支持MR程序讀取數據;
存儲非結構化和半結構化數據;
還可利用 Zookeeper 作為協同服務
hbase可以存小文件,結構,非結構數據,hdfs 適合儲存大文件
查看全部 -
YARN:
? ? ? ? ? ? ?負責整個集群的資源管理和調度
? ? ? ? ? ? ?支持多種計算框架:離線批處理,內存計算,迭代計算等等
查看全部 -
數據塊是抽象塊而非整個文件作為存儲單元
默認大小64M,一般設置為128M,備份X3
查看全部 -
HDFS實際操作(通過shell命令和python程序)
MapReduce程序開發實例
查看全部 -
大數據:大數據是一個概念也是一門技術,是在以Hadoop為代表的大數據平臺框架上進行各種數據分析的技術。
大數據包括了以Hadoop和Spark為代表的基礎大數據框架,還包括了實時數據處理,離線數據處理;數據分析,數據挖掘和用機器算法進行預測分析等技術。
查看全部 -
HDFS缺點
查看全部 -
HDFS優點
查看全部 -
NameNode
查看全部 -
默認大小為64MB,一般設置為128M,備份X3? ? ? ? ? ? ??
查看全部 -
HDFS總結
查看全部 -
Linux常用命令
查看全部 -
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?大數據? ? ? ? ? ? ??
以Hadoop為代表
數據分析的技術
查看全部
舉報