【HBase】(7)-HBase常用API
原创
©著作权归作者所有:来自51CTO博客作者Lineage_的原创作品,请联系作者获取转载授权,否则将追究法律责任
文章目录
- 1.导入HBase依赖
- 2.获取Configuration对象
- 3.判断表是否存在
- 4.创建一张新表
- 5.删除表
- 6.创建命名空间
- 1.向表中插入数据
- 2.读取表中数据(通过get对象,rowKey)
- 3.获取数据通过Scan扫描器
简 介:HBase是谷歌BigData论文的一个代码实现,在大数据处理领域应用广泛。本文意在记录自己近期学习过程中的所学所得,如有错误,欢迎大家指正。
关键词:大数据组件、HBase、NoSQL
一、HBase API学习
(一)、DDL操作
1.导入HBase依赖
<dependencies>
<dependency>
<groupId>org.apache.hbase</groupId>
<artifactId>hbase-server</artifactId>
<version>1.3.1</version>
</dependency>
<dependency>
<groupId>org.apache.hbase</groupId>
<artifactId>hbase-client</artifactId>
<version>1.3.1</version>
</dependency>
</dependencies>
2.获取Configuration对象
这是过时的方式,现在使用工厂模式进行创建连接,但是不影响使用。
Configuration conf = HBaseConfiguration.create();
# 配置zookeeper集群,端口可以不用配置,默认就是2181
conf.set("hbase.zookeeper.quorum", "hadoop102,hadoop103,hadoop103");
3.判断表是否存在
首先需要获取一个配置类对象,用于配置HBase集群相关的属性,然后新的方式需要创建一个Connection对象,但是Connection是一个接口,不能够直接创建,需要用工厂类进行创造一个Connection对象,然后利用该对象获取客户端对象Admin。
创建相关配置
Configuration conf = null;
Connection connection = null;
Admin admin = null;
@Before
public void init() throws Exception {
conf = HBaseConfiguration.create();
conf.set("hbase.zookeeper.quorum", "hadoop102,hadoop103,hadoop104");
connection = ConnectionFactory.createConnection(conf);
admin = connection.getAdmin();
}
代码
@Test
public void isExistTable() throws IOException {
String tableName="stu";
boolean result = admin.tableExists(TableName.valueOf(tableName));
System.out.println(result);
}
关闭资源
@After
public void close() throws Exception {
if (admin != null) {
admin.close();
}
if (connection != null) {
connection.close();
}
}
这里注意一下,我们要操纵HBase进行DML操作,那么就需要一个客户端对象,new对象的同时需要传入一个配置对象,配置集群,而且当我们使用完客户端对象的时候记得close一下
进行代码测试一下:
4.创建一张新表
使用JavaAPI创建一张新表的流程为:
- 获取一个表的描述器
- 遍历列族,为每个列族创建一个列的描述器
- 将每个描述器添加到表的描述器中
- 使用客户端对象进行创建表
public static void createTable(String tableName, String... cfs) throws IOException {
//判断列族是否为0
if (cfs.length <= 0) {
System.out.println("列族为0");
return;
}
//判断表是否存在
if (isExistTable(tableName)) {
System.out.println("当前表已经存在");
return;
}
//创建一个表的描述器
HTableDescriptor tableDescriptor = new HTableDescriptor(TableName.valueOf(tableName));
//创建列族
for (String cf : cfs) {
HColumnDescriptor columnDescriptor = new HColumnDescriptor(cf);
tableDescriptor.addFamily(columnDescriptor);
}
//创建新表
admin.createTable(tableDescriptor);
System.out.println("创建成功");
}
5.删除表
我们注意一下,HBase不同于mysql这些,当我们删除一张表时,需要将这张表进行下线,然后再将其删除。
public static void deleteTable(String tableName) throws IOException {
if (!isExistTable(tableName)) {
System.out.println("表不存在");
return;
}
//将表进行下线
admin.disableTable(TableName.valueOf(tableName));
//删除表
admin.deleteTable(TableName.valueOf(tableName));
System.out.println("删除成功");
}
6.创建命名空间
创建命名空间同样也需要创建一个描述器,然后用admin对象进行创建一个命名空间。
public static void createNameSpace(String nameSpace) throws IOException {
NamespaceDescriptor namespaceDescriptor = NamespaceDescriptor.create(nameSpace).build();
admin.createNamespace(namespaceDescriptor);
System.out.println("创建成功");
}
(二)、DML操作
1.向表中插入数据
插入数据的流程为:
- 使用connection对象与表进行连接,获取表对象
- new一个put对象,对应一个rowKey
- 向put对象进行插入每列的值
- 将put对象放到表中
public static void insertData(String tableName, String rowKey, String cf, String cn, String value) throws IOException {
Table table = connection.getTable(TableName.valueOf(tableName));
Put put = new Put(Bytes.toBytes(rowKey));
put.addColumn(Bytes.toBytes(cf), Bytes.toBytes(cn), Bytes.toBytes(value));
table.put(put);
table.close();
}
上面注意使用完表之后要将其进行关闭。
2.读取表中数据(通过get对象,rowKey)
读取数据流程:
- 创建表连接
- 获得get对象
- 通过rowKey拿到所有rowKey对应的结果
- 遍历结果集中的Cell
public static void getData(String tableName, String rowKey, String cf, String cn) throws IOException {
Table table = connection.getTable(TableName.valueOf(tableName));
Get get = new Get(Bytes.toBytes(rowKey));
Result result = table.get(get);
for (Cell cell : result.rawCells()) {
System.out.println("列族:" + Bytes.toString(CellUtil.cloneFamily(cell)));
System.out.println("列名:" + Bytes.toString(CellUtil.cloneQualifier(cell)));
System.out.println("值:" + Bytes.toString(CellUtil.cloneValue(cell)));
}
table.close();
}
3.获取数据通过Scan扫描器
我们如果范围取值,或者扫描全表就需要使用Scan扫描器。
table.getScanner(scan)获得的是一个结果集,其实这里可以不是迭代器,result可以迭代是因为HBase是存储大数据的,而且进行扫描全表的时候出来的数据会较多,所以将数据分成几个结果,每个结果再进行cell迭代。
public static void scanData(String tableName, String rowKey, String cf, String cn) throws IOException {
Table table = connection.getTable(TableName.valueOf(tableName));
Scan scan = new Scan();
ResultScanner results = table.getScanner(scan);
for (Result result : results) {
for (Cell cell : result.rawCells()) {
System.out.println("列族:" + Bytes.toString(CellUtil.cloneFamily(cell)));
System.out.println("列名:" + Bytes.toString(CellUtil.cloneQualifier(cell)));
System.out.println("值:" + Bytes.toString(CellUtil.cloneValue(cell)));
}
}
table.close();
}