启动hadoop

[root@Tyler03 ~]# start-all.sh

启动zookeeper

[root@Tyler01 bin]# zkServer.sh start

zookeeper可以写个shell脚本启动如下:

cdh dhfs hbase 用户名 密码 hbase 创建用户_数据


启动HBase

[root@Tyler01 bin]# start-hbase.sh

进入HBase客户端命令操作界面

[root@Tyler01 bin]# hbase shell

查看帮助命令

hbase(main):001:0> help

查看当前数据库中有哪些表

hbase(main):002:0> list

建表
创建user表,包含info、data两个列族

hbase(main):010:0> create 'user', 'info', 'data'

hbase(main):010:0> create 'user', {NAME => 'info', VERSIONS => '3'},{NAME => 'data'}

添加数据

向user表中插入信息,row key为rk0001,列族info中添加name列标示符,值为zhangsan

hbase(main):011:0> put 'user', 'rk0001', 'info:name', 'zhangsan'

向user表中插入信息,row key为rk0001,列族info中添加gender列标示符,值为female

hbase(main):012:0> put 'user', 'rk0001', 'info:gender', 'female'

向user表中插入信息,row key为rk0001,列族info中添加age列标示符,值为20

hbase(main):013:0> put 'user', 'rk0001', 'info:age', 20

向user表中插入信息,row key为rk0001,列族data中添加pic列标示符,值为picture

hbase(main):014:0> put 'user', 'rk0001', 'data:pic', 'picture'

查询数据操作

1、通过rowkey进行查询
获取user表中row key为rk0001的所有信息

hbase(main):015:0> get 'user', 'rk0001'

2、查看rowkey下面的某个列族的信息
获取user表中row key为rk0001,info列族的所有信息

hbase(main):016:0> get 'user', 'rk0001', 'info'

3、查看rowkey指定列族指定字段的值
获取user表中row key为rk0001,info列族的name、age列标示符的信息

hbase(main):017:0> get 'user', 'rk0001', 'info:name', 'info:age'

4、查看rowkey指定多个列族的信息
获取user表中row key为rk0001,info、data列族的信息

hbase(main):018:0> get 'user', 'rk0001', 'info', 'data'

hbase(main):019:0> get 'user', 'rk0001', {COLUMN => ['info', 'data']}

hbase(main):020:0> get 'user', 'rk0001', {COLUMN => ['info:name', 'data:pic']}

指定rowkey与列值查询

获取user表中row key为rk0001,cell的值为zhangsan的信息

hbase(main):015:0> get 'user','rk001',{FILTER => "ValueFilter(=,'binary:zhangsan')"}

指定rowkey与列值模糊查询

获取user表中row key为rk0001,列标示符中含有a的信息

hbase(main):031:0> get 'user', 'rk0001', {FILTER => "(QualifierFilter(=,'substring:a'))"}

继续插入一批数据

hbase(main):032:0> put 'user', 'rk0002', 'info:name', 'fanbingbing'
hbase(main):033:0> put 'user', 'rk0002', 'info:gender', 'female'
hbase(main):034:0> put 'user', 'rk0002', 'info:nationality', '中国'
hbase(main):035:0> get 'user', 'rk0002', {FILTER => "ValueFilter(=, 'binary:中国')"}  #中国查看时会乱码,但使用不影响

查询所有数据

查询user表中的所有信息

hbase(main):036:0> scan 'user'

查询user表中列族为info的信息

hbase(main):037:0> scan 'user', {COLUMNS => 'info'}

查询user表中列族为info和data的信息

hbase(main):038:0> scan 'user', {COLUMNS => ['info', 'data']}

查询列族里的列名

hbase(main):039:0> scan 'user', {COLUMNS => ['info:name', 'data:pic']}

查询user表中列族为info、列标示符为name的信息

hbase(main):040:0> scan 'user', {COLUMNS => 'info:name'}

查询user表中列族为info、列标示符为name的信息,并且版本最新的5个

hbase(main):041:0> scan 'user', {COLUMNS => 'info:name', VERSIONS => 5}

查询user表中列族为info和data且列标示符中含有a字符的信息

hbase(main):001:0> scan 'user',{COLUMNS => ['info','data'],FILTER => "(QualifierFilter(=,'substring:a'))"}

查询user表中列族为info,rk范围是[rk0001, rk0003)的数据

hbase(main):003:0> scan 'user', {COLUMNS => 'info', STARTROW => 'rk0001', ENDROW => 'rk0003'}

查询user表中row key以rk字符开头的

hbase(main):004:0> scan 'user',{FILTER=>"PrefixFilter('rk')"}

将user表的f1列族版本号改为5

hbase(main):050:0> alter 'user', NAME => 'info', VERSIONS => 5

指定rowkey,列名以及字段值进行删除

hbase(main):019:0> delete 'user','rk002','info:nation',1570642508562

删除user表row key为rk0001,列标示符为info:name的数据

hbase(main):045:0> delete 'user', 'rk0001', 'info:name'

删除一个列族

hbase(main):021:0> alter 'user' ,NAME => 'info',METHOD =>'delete'

hbase(main):021:0> alter 'user', 'delete' => 'info'

清空表数据

hbase(main):023:0> truncate 'user'

首先需要先让该表为disable状态,使用命令:

hbase(main):049:0> disable 'user'

然后才能drop这个表,使用命令:

hbase(main):050:0> drop 'user'

(注意:如果直接drop表,会报错:Drop the named table. Table must first be disabled)
统计一张表有多少行数据

hbase(main):053:0> count 'user'

drop、delete、truncate区别
相同点:

  1. truncate和不带where子句的delete、以及drop都会删除表内的数据。
  2. drop、truncate都是DDL语句(数据定义语言),执行后会自动提交。
    不同点:
  3. truncate 和 delete 只删除数据不删除表的结构(定义),drop 语句将表所占用的空间全部释放。
  4. delete 语句是数据库操作语言(dml)
    truncate、drop 是数据库定义语言(ddl),操作立即生效