-
Hbase shell
Create?'表名','表名' Describe?'表名' is_enabled????????//查看表是否可用 Drop?'表名' Enable Disable?'表名'????//先禁用,才能刪除表 is_disabled List scan?'表名' put?'表名','rowkey','列簇:列名','value'
查看全部 -
Hbase/conf/hbase-env.sh
export?JAVA_HOME=/jdk export?HBASE_MANAGES_ZK?=false??//禁用自帶的zookeeper
hbase-site.xml
<!--?hadoop集群名稱?--> <property> ????<name>hbase.rootdir</name> ????<value>hdfs://mycluster/hbase</value> ??</property> ????<!—是否依賴zookeeper—> ??<property> ????<name>hbase.zookeeper.quorum</name> ????<value>hmaster1,hmater2,hslave1</value> ??</property> ??<property> ????<name>hbase.zookeeper.property.clientPort</name> ????<value>2181</value> ??</property> <!--??是否是完全分布式?--> ??<property> ????<name>hbase.cluster.distributed</name> ????<value>true</value> ??</property> <!--??完全分布式式必須為false??--> ??<property> ????<name>hbase.unsafe.stream.capability.enforce</name> ????<value>false</value> ??</property> <!--??指定緩存文件存儲的路徑?--> ????<property> ????????<name>hbase.tmp.dir</name> ????????<value>/home/hadoop/data01/hbase/hbase_tmp</value> ????</property> <!--??指定Zookeeper數據存儲的路徑??--> ????<property> ????????<name>hbase.zookeeper.property.dataDir</name> ????????<value>/home/hadoop/data01/hbase/zookeeper_data</value> </property>
regionservers:
添加DataNode的IP或者機器名即可,這個文件把RegionServer的節點列了下來
查看全部 -
1. zookeeper/conf/zoo_sample.cfg
->zoo.cfg
2. 數據存放目錄 zoo.cfg中dataDir? -> 創建data/zkdata
3. zoo.cfg中server.1 = hostname:2888:3888
4. 數據節點根目錄(zkdata)創建myid文件
zoo.cfg文件
"server.1=hmaster1:2888:3888"這一句中的server.1表示節點編號,"hmaster1"表示這臺服務器的主機名,也可以直接指定ip地址,"2888"是ZooKeeper服務間通信的端口,"3888"是ZooKeeper服務與其他服務通信的端口
dataDir指定ZooKeeper的數據目錄
autopurge.purgeInterval=1 表示開啟日志和鏡像文件自動清理功能
查看全部 -
!Hbase不支持條件查詢!
查看全部 -
rowkey行鍵:
1)它是表(table)的主鍵,table中的記錄按照rowkey的字典序進行排序
Column Family列族:
1)HBase表中的每個列,都歸屬于某個列族。
2)列族是表的schema的一部分(而列不是),即建表時至少指定一個列族。
3)比如我們創建user表,包含info、data兩個列族,代碼就為create 'user', 'info', 'data'。
Column列:
列肯定是表的某一個列族下的一個列,用列族名:列名表示,比如`info`列族下的`name`列,就表示為`info:name`。
Timestamp時間戳:
這個說的就是可以對表中的Cell多次賦值,每次賦值操作時的時間戳timestamp,可看成Cell值的版本號version number。
查看全部 -
Zookeeper:
① 它實現了HMaster的高可用,多HMaster間進行主備選舉。② 保存了HBase的元數據信息meta表。③ 對HMaster和HRegionServer各個節點進行監控。
HRegionServer:
HBase集群中從角色,是集群中的小弟。它主要負責響應客戶端的讀寫數據請求,以及負責管理一系列的Region。
Region:
HBase集群中分布式存儲的最小單元,一個Region對應一個Table表的部分數據。簡單理解就是表存儲在HBase中,并且都是以Region為單位進行存儲。
查看全部 -
容量大:百萬列行
面向列:列式存儲,面向列權限控制,獨立檢索。實時動態增加列
多版本:每一列數據存儲有多個版本
稀疏性:空的列不占用存儲空間,表可以設計的很稀疏
擴展性:底層依賴HDFS。動態增加datanode,不需要遷移
高可靠性:WAL機制保證數據寫入不會因為集群異常導致丟失。HDFS本身也有備份
高性能:底層LSM數據結構和Rowkey有序排列架構設計。寫入性能高。以樹節點相互合并由下往上。region切分,索引和緩存機制使hbase具備隨機讀取性能
查看全部 -
總結:
查看全部 -
HBase監控WEB頁面介紹
hbase-daemon.sh
start-hbase.sh
hbase-daemons.sh
stop-hbase.sh
HBase shell
查看全部 -
配置目錄在cf中
查看全部 -
HBase安裝說明:
????????????????????????????????JDK1.7以上
????????????????????????????????Hadoop-2.5.0以上
????????????????????????????????Zookeeper-3.4.5
查看全部 -
一個列簇有多個列
一張表列簇不會超過5個
每個列簇中的列數沒有限制
列只有插入數據后存在??
列在列簇中是有序的
HBase列是動態增加,數據自動切分,高并發讀寫,不支持條件查詢
關系數據庫列動態增加吧,數據自動切分,高并發讀寫,復雜查詢
查看全部 -
Hbase表模型查看全部
-
Hbase架構查看全部
-
Hbase的特點
查看全部
舉報