【HBase】(7)-HBase常用API

原创

Lineage_ 2023-01-17 01:37:47 博主文章分类：【大数据】HBase ©著作权

文章标签 spark hadoop hdfs mapreduce hbase 文章分类 虚拟化云计算

©著作权归作者所有：来自51CTO博客作者Lineage_的原创作品，请联系作者获取转载授权，否则将追究法律责任

文章目录

一、HBase API学习

（一）、DDL操作

1.导入HBase依赖
2.获取Configuration对象
3.判断表是否存在
4.创建一张新表
5.删除表
6.创建命名空间

（二）、DML操作

1.向表中插入数据
2.读取表中数据（通过get对象，rowKey）
3.获取数据通过Scan扫描器

【HBase】(7)-HBase常用API_hbase

简介：HBase是谷歌BigData论文的一个代码实现，在大数据处理领域应用广泛。本文意在记录自己近期学习过程中的所学所得，如有错误，欢迎大家指正。

关键词：大数据组件、HBase、NoSQL

一、HBase API学习

（一）、DDL操作

1.导入HBase依赖

<dependencies>
        <dependency>
            <groupId>org.apache.hbase</groupId>
            <artifactId>hbase-server</artifactId>
            <version>1.3.1</version>
        </dependency>
        <dependency>
            <groupId>org.apache.hbase</groupId>
            <artifactId>hbase-client</artifactId>
            <version>1.3.1</version>
        </dependency>
</dependencies>

2.获取Configuration对象

这是过时的方式，现在使用工厂模式进行创建连接，但是不影响使用。

Configuration conf = HBaseConfiguration.create();
# 配置zookeeper集群，端口可以不用配置，默认就是2181
conf.set("hbase.zookeeper.quorum", "hadoop102,hadoop103,hadoop103");

3.判断表是否存在

首先需要获取一个配置类对象，用于配置HBase集群相关的属性，然后新的方式需要创建一个Connection对象，但是Connection是一个接口，不能够直接创建，需要用工厂类进行创造一个Connection对象，然后利用该对象获取客户端对象Admin。

创建相关配置

Configuration conf = null;
Connection connection = null;
Admin admin = null;

@Before
public void init() throws Exception {
    conf = HBaseConfiguration.create();
    conf.set("hbase.zookeeper.quorum", "hadoop102,hadoop103,hadoop104");

    connection = ConnectionFactory.createConnection(conf);

    admin = connection.getAdmin();
}

代码

@Test
public void isExistTable() throws IOException {
    String tableName="stu";

    boolean result = admin.tableExists(TableName.valueOf(tableName));

    System.out.println(result);
}

关闭资源

@After
public void close() throws Exception {
    if (admin != null) {
        admin.close();
    }

    if (connection != null) {
        connection.close();
    }
}

这里注意一下，我们要操纵HBase进行DML操作，那么就需要一个客户端对象，new对象的同时需要传入一个配置对象，配置集群，而且当我们使用完客户端对象的时候记得close一下

【HBase】(7)-HBase常用API_spark_02

进行代码测试一下：

【HBase】(7)-HBase常用API_spark_03

【HBase】(7)-HBase常用API_hdfs_04

4.创建一张新表

使用JavaAPI创建一张新表的流程为：

获取一个表的描述器
遍历列族，为每个列族创建一个列的描述器
将每个描述器添加到表的描述器中
使用客户端对象进行创建表

public static void createTable(String tableName, String... cfs) throws IOException {
        //判断列族是否为0
        if (cfs.length <= 0) {
            System.out.println("列族为0");
            return;
        }

        //判断表是否存在
        if (isExistTable(tableName)) {
            System.out.println("当前表已经存在");
            return;
        }

        //创建一个表的描述器
        HTableDescriptor tableDescriptor = new HTableDescriptor(TableName.valueOf(tableName));

        //创建列族
        for (String cf : cfs) {
            HColumnDescriptor columnDescriptor = new HColumnDescriptor(cf);

            tableDescriptor.addFamily(columnDescriptor);
        }

        //创建新表
        admin.createTable(tableDescriptor);
        System.out.println("创建成功");
    }

5.删除表

我们注意一下，HBase不同于mysql这些，当我们删除一张表时，需要将这张表进行下线，然后再将其删除。

public static void deleteTable(String tableName) throws IOException {
        if (!isExistTable(tableName)) {
            System.out.println("表不存在");
            return;
        }

        //将表进行下线
        admin.disableTable(TableName.valueOf(tableName));
        //删除表
        admin.deleteTable(TableName.valueOf(tableName));
        System.out.println("删除成功");
    }

6.创建命名空间

创建命名空间同样也需要创建一个描述器，然后用admin对象进行创建一个命名空间。

public static void createNameSpace(String nameSpace) throws IOException {
        NamespaceDescriptor namespaceDescriptor = NamespaceDescriptor.create(nameSpace).build();

        admin.createNamespace(namespaceDescriptor);
        System.out.println("创建成功");
    }

（二）、DML操作

1.向表中插入数据

插入数据的流程为：

使用connection对象与表进行连接，获取表对象
new一个put对象，对应一个rowKey
向put对象进行插入每列的值
将put对象放到表中

public static void insertData(String tableName, String rowKey, String cf, String cn, String value) throws IOException {
        Table table = connection.getTable(TableName.valueOf(tableName));

        Put put = new Put(Bytes.toBytes(rowKey));

        put.addColumn(Bytes.toBytes(cf), Bytes.toBytes(cn), Bytes.toBytes(value));

        table.put(put);

        table.close();
    }

【HBase】(7)-HBase常用API_hdfs_05

【HBase】(7)-HBase常用API_hadoop_06

上面注意使用完表之后要将其进行关闭。

2.读取表中数据（通过get对象，rowKey）

读取数据流程：

创建表连接
获得get对象
通过rowKey拿到所有rowKey对应的结果
遍历结果集中的Cell

public static void getData(String tableName, String rowKey, String cf, String cn) throws IOException {
        Table table = connection.getTable(TableName.valueOf(tableName));

        Get get = new Get(Bytes.toBytes(rowKey));

        Result result = table.get(get);

        for (Cell cell : result.rawCells()) {
            System.out.println("列族：" + Bytes.toString(CellUtil.cloneFamily(cell)));
            System.out.println("列名：" + Bytes.toString(CellUtil.cloneQualifier(cell)));
            System.out.println("值：" + Bytes.toString(CellUtil.cloneValue(cell)));
        }

        table.close();
    }

【HBase】(7)-HBase常用API_spark_07

3.获取数据通过Scan扫描器

我们如果范围取值，或者扫描全表就需要使用Scan扫描器。

table.getScanner(scan)获得的是一个结果集，其实这里可以不是迭代器，result可以迭代是因为HBase是存储大数据的，而且进行扫描全表的时候出来的数据会较多，所以将数据分成几个结果，每个结果再进行cell迭代。

public static void scanData(String tableName, String rowKey, String cf, String cn) throws IOException {
        Table table = connection.getTable(TableName.valueOf(tableName));

        Scan scan = new Scan();

        ResultScanner results = table.getScanner(scan);

        for (Result result : results) {
            for (Cell cell : result.rawCells()) {
                System.out.println("列族：" + Bytes.toString(CellUtil.cloneFamily(cell)));
                System.out.println("列名：" + Bytes.toString(CellUtil.cloneQualifier(cell)));
                System.out.println("值：" + Bytes.toString(CellUtil.cloneValue(cell)));
            }
        }

        table.close();

    }

上一篇：【HBase】(6)-Compact合并StoreFile流程

下一篇：【HBase】(4)-HBase写数据流程

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯