这节主要学习 HiveQL
查询语言
HiveQL 是 Apache Hive 的查询语言,它使用类 SQL 语法,在 Hive 中可以使用 HiveQL 查询和处理分布式存储的数据。
以下是一些 HiveQL 的常用语法和示例:
- 创建表格:
CREATE TABLE my_table (
id INT,
name STRING,
age INT
)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ',';
- 在表格中插入数据:
INSERT INTO my_table VALUES (1, 'Tom', 22);
- 查询表格:
SELECT * FROM my_table;
- 修改表格:
ALTER TABLE my_table ADD COLUMN gender STRING;
- 聚合查询:
SELECT COUNT(*) FROM my_table;
SELECT AVG(age), MAX(age), MIN(age) FROM my_table WHERE gender = 'male';
- 连接查询:
SELECT t1.id, t1.name, t2.sale
FROM table1 t1
JOIN table2 t2
ON t1.id = t2.id;
- 分组查询:
SELECT gender, AVG(age) FROM my_table GROUP BY gender;
- 排序查询:
SELECT * FROM my_table ORDER BY age DESC;
- 子查询:
SELECT id, name FROM my_table WHERE age IN (SELECT age FROM my_table WHERE gender = 'male');
以上是 HiveQL 的一些常用语法和示例。HiveQL 基本上支持大部分 SQL 的基本语句,包括 SELECT、JOIN、GROUP BY、ORDER BY 等等。
使用过程中遇到了问题,可以参考 Hive 的官方文档并进行进一步的学习和了解。