-
hbase能做什么
1、海量數據存儲
關系型數據庫的字段一般在30內,超過則說明表的設計有問題,而hbase并沒有列的限制(上百億行、上百萬列)
2、準實時查詢
查看全部 -
課程目標
1、Hbase的應用場景及特點(為什么要學習這門技術,在業務場景中能夠解決什么問題、提供什么樣的服務)
2、habse架構體系與設計模型(架構體系:包含哪些進程、進程與進程之間的關系、Hbase服務于其他大數據服務之間的關系和依賴)(設計模型:hbase表結構的模型、表數據的模型)
查看全部 -
容量大
面向列
多版本
稀疏性,為空的列不占用存儲空間
擴展性(底層依賴HDFS)
高可靠行(Replication以及底層的HDFS也有備份)
高性能(寫:LSM數據結構;讀:rowKey有序排列,region切分、主鍵索引和緩存機制)。
查看全部 -
Hbase與關系型數據庫的對比
查看全部 -
海量數據查詢:百億行乘以百萬列的數據量。mysql推薦千萬行時進行分表。
準實時查詢:查詢速度百毫秒內。
查看全部 -
????rowkey相當于表的行主鍵。timestamp是時間戳。Hbase是基于key-value形式的。所以在列簇內,每一列都有一個key和value。
????列簇的注意事項:
????????1、一張表的列簇不會超過5個,超過5個會影響查詢效率
????????2、每個列簇中的列數沒有限制
????????3、列只有插入數據后才會存在,沒插入數據不會占用磁盤空間
????????4、創建表只需要確定有多少個列簇即可,不需要創建列,列動態增加。
????????5、列在列簇中是有序的
?? ?? ? Hbase和關系型數據庫的對比:
?? ??? ?? ? Hbase表內的列是動態增加的,關系型數據庫是不能動態增加。
?? ??? ?? ? Hbase表內的數據會自動切分,關系型數據庫表內數據不會自動切分。當數據量很大是,關系型數據庫要進行分庫分表。?? ?
?? ??? ?? ? Hbase支持高并發讀取,關系型數據庫不支持,需要通過第三方插件、緩存來實現減少訪問數據庫。
????????????Hbase不支持條件查詢,只支持Rowkey查詢,關系型數據庫支持復雜查詢。
????????????
查看全部 -
在創建Hbase表的時候,不需要創建列,只需要創建對應的列簇即可。列簇內的列的數量是可以設置超過上百萬個的,列的個數不需要一開始就設定,可以后續動態增加。但是列簇建議不要多余5個。每個列簇,相當于一個分類。
查看全部 -
使用Hbase,需要先安裝HDFS分布式文件系統和Zookeeper注冊中心。
Hbase包括主進程master和多個regionServer子進程。
當表數據量很大的時候,可以對表進行分區,分成多個region。regionServer負責管理region.
regionServer會將分區的運行情況報告給master,方便master隨時將宕機的region分配到其他的region。
regionServer也會將分區的運行情況報告給zookeeper。
查看全部 -
Hbase的應用場景:
????
查看全部 -
HBase 模型圖
查看全部 -
HBase用途
查看全部 -
HBASE監控界面
查看全部 -
HBASE和關系數據庫的區別
查看全部 -
Hadoop生態圖
查看全部 -
在時間4.20 有各軟件版本對應說明
查看全部
舉報