HBase 精选思维导图,一图胜千言:
https://mm.edrawsoft.cn/wx.html?work_id=206852
启动时需顺序:
先启动hdfs -> 启动yarn -> 启动zookeeper -> 启动hbase
启动hbase集群
start-hbase.sh #jps:HMaster, HRegionServer
stop-hbase.sh
访问WebUI,在浏览器输入:192.168.88.161:16010
启动hbase hsell
hbase shell
查看某命令
help "create"
查看hbase集群状态
status
查看hbase中的表
list
创建表
create "表名", "列族1", "列族2"... #至少指定一个列族名
create "名称空间:表名", "列族" #创建时使用了名称空间,后续使用都必须带上名称空间,否则会到default中找到这个表
插入数据,插入即更新
put "表名", "rowkey", "列族:列限定符", "值"
#例子
put "day01", "rk001", "c1:name", "张三"
获取数据
get "表名", "rowkey"[, "列族:列限定符" ]
scan扫描
# 全表扫描
scan "表名"
# COLUMNS VERSIONS LIMIT等都是大写,不能写成小写
scan "表名"[,{COLUMNS=>["列族", "列族:列限定符"], VERSIONS=>N, LIMIT=>N, FORMATTER=>"toString"} ]
# 例子
scan "test", {COLUMNS=>["c1:name"], LIMIT=>10}
修改源数据
# 添加列族
alter "表名", NAME=>"列族名"
# 添加列族,同时指定版本数
alter "表名", NAME=>"列族名", VERSION=>N
# 修改版本数
alter "表名", VERSIONS=>?
# 删除列族
alter "表名", 'delete'=>"列族名"
删除命令
delete "表名", "rowkey", "列族:列限定符"
清空表
truncate "表名"
删除一张表,得先禁用
# 禁用表
disable "表名"
# 删除表
drop "表名"
# 启用表
enable "表名"
统计行数
count "表名"
将Hfile文件加载到HBase中
# 这个命令在终端中执行,不是咋hbase shell
hbase org.apache.hadoop.hbase.tool.LoadIncrementalHFiles /hbase/bulkload/output TRANSFER_RECORD
创建名称空间
create_namespace "名称空间"
查看名称空间列表
list_namespace
查看名称空间详情
describe_namespace "名称空间"
指定压缩方案
# 创建表时指定
create "表名", "列族", {COMPRESSION=>"压缩方案"} #压缩方案:gzip写少读多、snappy读多写少
# 同一个列族使用的压缩方案相同
alter " 表名", "列族", {COMPRESSION=>"压缩方案"}
创建表时指定分区边界
create "表名", "列族"[ , "列族1" ... ] SPLITS=>[分区边界]
create "test03", "C1", SPLITS=>['10','20','30']
hash分区方案
create "test04", "C1", {NUMREGIONS=>16, SPLITALGO=>"NUMREGIONS"}