HBase Shell操作整理
- 一、基本操作
- 二、库的操作
- 三、表的操作
- 四、查询数据
一、基本操作
- 进入HBase客户端:hbase shell
- 查看帮助命令:help
- 查看当前数据库中有哪些表:list
- 查看当前用户:whoami
二、库的操作
hbase里的数据库叫namespace,一个namespace下面有多个表
- 查看命名空间:list_namespace
- 创建命名空间:create_namespace ‘kb10’
- 删除命名空间:drop_namespace ‘kb10’
三、表的操作
- 表操作冒号是引用符
- 列出当前命名空间的所有表:list_namespace_tables ‘kb10’#
- 列出所有表:list
- 查看表的信息:status desc ‘NAMESPACE:TABLE’
- 启用或禁用列簇:enable/disable ‘NAMESPACE:TABLE’
- 查看列簇的状态:is_disable/is_enable ‘NAMESPACE:TABLE’
- 创建列簇:create ‘kb10:student’,‘basicinfo’,‘stuinfo’#新建一张表,列簇为basicinfo和stuinfo
创建完之后,可在HDFS里hbase/data下查看表文件目录 - 删除表,删除前要把表里的列簇禁用掉:drop ‘NAMESPACE:TABLE’
- 添加数据:put ‘NAMESPACE:TABLE’,‘rowkey值’,‘列簇名:列名’,‘值’
- 把数据写入磁盘:flush ‘NAMESPACE:TABLE’ 。在put数据后,可以看到HDFS系统里并没有添加任何数据,可以说明写入的过程是写在内存里的,而在flush之后,HDFS里便有了数据。
- 扫描全表数据:scan ‘NAMESPACE:TABLE’
- 扫描特定列的数据:scan ‘kb10:student’,{COLUMNS=>[‘basicinfo:name’],VERSIONS=>3}
- 获取指定cell的数据:get ‘NAMESPACE:TABLE’,‘FAMILY:COLUMN’
- 列簇目录下的文件,可以使用hdfs命令查看内容:hbase hfile -v -p -f file_path
- 查看表结构:desc ‘NAMESPACE:TABLE_NAME’
- 更新指定字段的数据 put ‘customer’, ‘jsmith’, ‘order:numb’, ‘654321’
- 查看“指定行”或“指定列族:列”的数据
get ‘customer’, ‘jsmith’
get ‘customer’, ‘jsmith’,‘addr’
get ‘customer’, ‘jsmith’,‘addr:city’ - 统计表数据行数 count ‘customer’
- 清空表数据 truncate ‘customer’
- 删除某 rowkey 的全部数据 deleteall ‘customer’,‘jsmith’
- 删除某 rowkey 的某一列数据: delete ‘customer’,‘njones’,‘addr:city’
四、查询数据
- 查询前十条数据
例:scan ‘book:info’,{LIMIT=>10} - 查询前十条c:q列的数据
例:scan ‘book:info’,{COLUMNS=>‘c:q’,LIMIT=>10} - 查询rowkey从’1000’到’2000’,列族为c:q的数据
例:scan ‘book:info’,{STARTROW=>‘1000’,ENDROW=>‘2000’,COLUMN=>‘c:q’}’’ - PrefixFilter:rowkey 前缀过滤。ps查询rowkey前缀为100的数据
例:scan ‘book:info’,{FILTER=>“PrifixFilter(‘100’)”} - 查询rowkey中包括0778的数据
例:scan ‘book:info’,{FILTER=>“RowFilter(=,‘substring:0778’)”,LIMIT=>10} - QualifierFilter(CompareFilter.Compare op, ByteArrayComparable qualifierComparator)
QualifierFilter按照列的名称过滤。
例:scan ‘book:info’,{FILTER=>“PrefixFilter(‘100’) AND QualifierFilter(=,‘regexstring:q’)”} - ColumnPrefixFilter(byte[] prefix) 注意:一个列名是可以出现在多个列族中,该过滤器将返回所有列族中匹配的列
===(与上一句的查询结果一样)
例:scan ‘book:info’,{FILTER=>“PrefixFilter(‘100’) AND ColumnPrefixFilter(‘q’)”} - MultipleColumnPrefixFilter 基于多个列名前缀过滤数据
例:scan ‘book:info’,{FILTER=>“MultipleColumnPrefixFilter(‘q1’,‘q2’,‘q3’)”,LIMIT=>10} - ColumnRangeFilter(byte[] minColumn,boolean minColumnclusive,byte[] maxColumn,boolean maxColumnInclusive)
minColumn -列范围的最小值,如果为空,则没有下限
minColumnInclusive -列范围是否包含minColumn
maxColumn -列范围的最大值,如果为空,则没有上限
maxColumnInclusive -列范围是否包含maxColumn
例:scan ‘book:info’ {FILTER=>“ColumnRangeFilter(‘q’,true,‘q4’,false)”,LIMIT=>10} - SingleColumnValueFilter(byte[] family,byte[] qualifier, CompareFilter.CompareOp, compareOp, ByteArrayComparable comparator) 比较列的关键字查询
例:scan ‘book:info’,{FILTER=>“SingleColumnValueFilter(‘c’,‘q1’,=,‘substring:1’)”,LIMIT=>10} - FirstKeyOnlyFilter()函数每一行的第一个cell的值,可以用于高效的执行统计行数,但具体作用总觉得不大。
例:scan ‘book:info’,{FILTER=>“FirstKeyOnlyFilter()”,LIMIT=>10}