假设这里要创建一个表student,该表包含SnameSsexSageSdeptcourse等字段。需要注意的是,在关系型数据库(比如MySQL)中,需要首先创建数据库,然后再创建表,但是,在HBase数据库中,不需要创建数据库,只要直接创建表就可以。在HBase中创建student表的Shell命令如下:

hbase> create 'student','Sname','Ssex','Sage','Sdept','course'

对于HBase而言,在创建HBasae表时,不需要自行创建行健,系统会默认一个属性作为行键,通常是把put命令操作中跟在表名后的第一个数据作为行健。

创建完student表后,可通过describe命令查看student表的基本信息,命令如下:

hbase>describe 'student'

可以使用list命令查看当前HBase数据库中已经创建了哪些表,命令如下:

hbase> list

2 添加数据

HBase使用put命令添加数据,一次只能为一个表的一行数据的一个列(也就是一个单元格,单元格是HBase中的概念)添加一个数据,所以,直接用Shell命令插入数据效率很低,在实际应用中,一般都是利用编程操作数据。因为这里只要插入1条学生记录,所以,我们可以用Shell命令手工插入数据,命令如下:

hbase> put 'student','95001','Sname','LiYing'

上面的put命令会为student表添加学号为95001、名字为LiYing的一个单元格数据,其行键为95001,也就是说,系统默认把跟在表名student后面的第一个数据作为行健。

下面继续添加4个单元格的数据,用来记录LiYing同学的相关信息,命令如下:

hbase> put 'student','95001','Ssex','male'hbase> put 'student','95001','Sage','22' hbase> put 'student','95001','Sdept','CS' hbase> put 'student','95001','course:math','80'

3 查看数据

HBase中有两个用于查看数据的命令:

  • get命令:用于查看表的某一个单元格数据;
  • scan命令:用于查看某个表的全部数据。

比如,可以使用如下命令返回student表中95001行的数据:

hbase> get 'student','95001'

下面使用scan命令查询student表的全部数据:

hbase> scan 'student'

4 删除数据

在HBase中用delete以及deleteall命令进行删除数据操作,二者的区别是:delete命令用于删除一个单元格数据,是put的反向操作,而 deleteall命令用于删除一行数据。

首先,使用delete命令删除student表中95001这行中的Ssex列的所有数据,命令如下:

hbase > delete 'student','95001','Ssex'

然后,使用deleteall命令删除student表中的95001行的全部数据,命令如下:

hbase> deleteall 'student','95001'

5 删除表

删除表需要分两步操作,第一步先让该表不可用,第二步删除表。比如,要删除student表,可以使用如下命令:

hbase> disable 'student'  hbase> drop 'student'

6 查询历史数据

在添加数据时,HBase会自动为添加的数据添加一个时间戳。在修改数据时,HBase会为修改后的数据生成一个新的版本(时间戳),从而完成“改”操作,旧的版本依旧保留,系统会定时回收垃圾数据,只留下最新的几个版本,保存的版本数可以在创建表的时候指定。

为了查询历史数据,这里创建一个teacher表,首先,在创建表的时候,需要指定保存的版本数(假设指定为5),命令如下:

hbase> create 'teacher',{NAME=>'username',VERSIONS=>5}

然后,插入数据,并更新数据,使其产生历史版本数据,需要注意的是,这里插入数据和更新数据都是使用put命令,具体如下:

hbase> put 'teacher','91001','username','Mary'hbase> put 'teacher','91001','username','Mary1' hbase> put 'teacher','91001','username','Mary2' hbase> put 'teacher','91001','username','Mary3' hbase> put 'teacher','91001','username','Mary4'   hbase> put 'teacher','91001','username','Mary5'

查询时,默认情况下回显示当前最新版本的数据,如果要查询历史数据,需要指定查询的历史版本数,由于上面设置了保存版本数为5,所以,在查询时制定的历史版本数的有效取值为1到5,具体命令如下:

hbase> get 'teacher','91001',{COLUMN=>'username',VERSIONS=>5}hbase> get 'teacher','91001',{COLUMN=>'username',VERSIONS=>3}

7 退出HBase数据库

最后退出数据库操作,输入exit命令即可退出,命令如下:

hbase> exit

注意,这里退出HBase数据库是退出HBase Shell,而不是停止HBase数据库后台运行,执行exit后,HBase仍然在后台运行,如果要停止HBase运行,需要使用如下命令:

$ bin/stop-hbase.sh

作业:使用Shell命令完成以下内容。(每道题目不仅要给出命令还要有运行结果截图)
  1. 创建《王者荣耀》游戏玩家信息表gamer,包含列族personalInfo(个人信息)、recordInfo(战绩信息)、assetsInfo(资产信息)。

create ‘gamer’, ‘personalInfo’, ‘recordInfo’, ‘assetsInfo’

HBASE 表设计_大数据

查看表的详细信息

describe ‘gamer’

HBASE 表设计_HBASE 表设计_02

修改gamer表中recordInfo列族的TTL信息设置为180天。

alter ‘gamer’,{NAME=>‘recordInfo’,TTL=>‘15552000’}

HBASE 表设计_大数据_03

向gamer表添加数据

personalInfo

recordInfo

assetInfo

nickname

gameID

ranking

row-001

QGhappy.Snow

000000

One

row-002

XQMaster

111111

Two