文章目录
- 一、准备工作
- 二、Hive数据库操作
- (一)Hive数据存储
- (二)创建数据库
- (三)查看数据库
- (四)修改数据库信息
- (五)使用数据库
- (六)删除数据库
- 三、Hive表操作
- (一)创建表
- (二)查看库里的表
- 1、在Hive里查看库里的表
- 2、在MySQL里查看Hive元数据
- 3、在HDFS上查看库里的表
- (三)插入表记录
- (四)查询表记录
- 1、查询全部记录
- Hive是一个建立在Hadoop上的数据仓库系统,它提供了类似于SQL的查询语言(称为HiveQL),允许用户通过类似于传统数据库的方式查询和分析存储在Hadoop分布式文件系统(HDFS)中的大规模数据集。
一、准备工作
二、Hive数据库操作
(一)Hive数据存储
(二)创建数据库
(三)查看数据库
- 注意,我们创建的hive数据库,对应的是HDFS上的目录,比如数据库
test01
,对应的就是test01.db
目录
(四)修改数据库信息
(五)使用数据库
(六)删除数据库
三、Hive表操作
- 在 Apache Hive 中,创建表是数据仓库操作的基本步骤之一。Hive 提供了多种方式来定义和管理表,包括内部表(managed table)、外部表(external table)和分区表(partitioned table)。
- 本节课,我们只学习内部表的操作。当你创建一个内部表时,Hive 会将数据移动到由
hive.metastore.warehouse.dir
配置属性指定的数据仓库目录下(我们配置的属性值是/user/hive/warehouse
)。删除内部表时,不仅元数据会被删除,存储在数据仓库中的实际数据也会被删除。 - 当你创建表时,你需要定义表的结构,即列名和相应的数据类型。你可以选择是否为表添加更多的属性,如注释(COMMENT)、行格式(ROW FORMAT)等。
(一)创建表
(二)查看库里的表
1、在Hive里查看库里的表
- 执行命令:
show tables;
2、在MySQL里查看Hive元数据
3、在HDFS上查看库里的表
- 执行命令:
hdfs dfs -ls /user/hive/warehouse/test01.db
(三)插入表记录
(四)查询表记录
1、查询全部记录
- select * from <表名>