HBase 精选思维导图,一图胜千言:

https://mm.edrawsoft.cn/wx.html?work_id=206852


启动时需顺序:

         先启动hdfs  ->  启动yarn  ->  启动zookeeper  ->  启动hbase



启动hbase集群

start-hbase.sh    #jps:HMaster, HRegionServer
stop-hbase.sh


访问WebUI,在浏览器输入:192.168.88.161:16010

启动hbase hsell

hbase shell


查看某命令

help "create"


查看hbase集群状态

status


查看hbase中的表

list


创建表

create "表名", "列族1", "列族2"...    #至少指定一个列族名

create "名称空间:表名", "列族"    #创建时使用了名称空间,后续使用都必须带上名称空间,否则会到default中找到这个表


插入数据,插入即更新

put "表名", "rowkey", "列族:列限定符", "值"

#例子
put "day01", "rk001", "c1:name", "张三"


获取数据

get "表名", "rowkey"[, "列族:列限定符" ]


scan扫描

# 全表扫描
scan "表名"

# COLUMNS VERSIONS LIMIT等都是大写,不能写成小写
scan "表名"[,{COLUMNS=>["列族", "列族:列限定符"], VERSIONS=>N, LIMIT=>N, FORMATTER=>"toString"} ]

# 例子
scan "test", {COLUMNS=>["c1:name"], LIMIT=>10}


修改源数据

# 添加列族
alter "表名", NAME=>"列族名"

# 添加列族,同时指定版本数
alter "表名", NAME=>"列族名", VERSION=>N

# 修改版本数
alter "表名", VERSIONS=>?

# 删除列族
alter "表名", 'delete'=>"列族名"


删除命令

delete "表名", "rowkey", "列族:列限定符"

清空表

truncate "表名"


删除一张表,得先禁用

# 禁用表
disable "表名"
# 删除表
drop "表名"
# 启用表
enable "表名"


统计行数

count "表名"


将Hfile文件加载到HBase中

# 这个命令在终端中执行,不是咋hbase shell
hbase org.apache.hadoop.hbase.tool.LoadIncrementalHFiles /hbase/bulkload/output TRANSFER_RECORD


创建名称空间

create_namespace "名称空间"


查看名称空间列表

list_namespace


查看名称空间详情

describe_namespace "名称空间"


指定压缩方案

# 创建表时指定
create "表名", "列族", {COMPRESSION=>"压缩方案"}    #压缩方案:gzip写少读多、snappy读多写少

# 同一个列族使用的压缩方案相同
alter " 表名", "列族", {COMPRESSION=>"压缩方案"}


创建表时指定分区边界

create "表名", "列族"[ , "列族1" ... ] SPLITS=>[分区边界]

create "test03", "C1", SPLITS=>['10','20','30']


hash分区方案

create "test04", "C1", {NUMREGIONS=>16, SPLITALGO=>"NUMREGIONS"}