-
寫流程簡述
查看全部 -
HDFS寫流程
查看全部 -
大數據概念
查看全部 -
introduction of Spark
查看全部 -
introduction of HBase
查看全部 -
Hadoop ecosystem
查看全部 -
MapReduce programming model
查看全部 -
Concepts of YARN
查看全部 -
common HDFS shell commands
查看全部 -
大數據:大數據是一個概念也是一門技術,是在以Hadoop為代表的大數據平臺框架上進行各種數據分析的技術。
大數據包括了以Hadoop和Spark為代表的基礎大數據框架,還包括了實時數據處理,離線數據處理;數據分析,數據挖掘和用機器算法進行預測分析等技術。
查看全部 -
Spark優勢
查看全部 -
Spark
查看全部 -
RowKey:數據唯一標識,按字典排序
Column Family:列族,多個列的集合,最多不超過3個
TimeStamp時間戳:支持多個版本數據同時存在
hbase可以存小文件,結構,非結構數據,hdfs 適合儲存大文件
查看全部 -
HBase(Hadoop Database)
是一個分布式 NoSQL 列存儲數據庫;
利用 HDFS 作為其文件存儲系統,支持MR程序讀取數據;
存儲非結構化和半結構化數據;
還可利用 Zookeeper 作為協同服務
hbase可以存小文件,結構,非結構數據,hdfs 適合儲存大文件
查看全部 -
Hadoop生態圈的內容
Hive是一個數據倉庫,提供大量結構化數據的檢索功能
HBase是一個列式數據庫
Spark是一個基于內存的分布式計算框架
查看全部
舉報