乐胖代购免代理版

欢迎

5、hive的load、insert、事务表使用详解及示例

比如，如果表具有分区，则load命令没有指定分区，则将load转换为INSERT AS SELECT，并假定最后一数据。

hive

hadoop

大数据

数据仓库

数据分析

原创 2023-06-10 05:52:34 2173 阅读 1点赞 1收藏

2、hive相关概念详解--架构、读写文件机制、数据存储

用户接口包括 CLI、JDBC/ODBC、WebGUI。CLI(command line interface)为shell命令行Hive

hive

架构

hadoop

大数据

数据分析

原创精选 2023-06-10 05:51:43 686 阅读 1点赞 1收藏

1、apache-hive-3.1.2简介及部署（三种部署方式-内嵌模式、本地模式和远程模式）及验证详解

Apache Hive是一款建立在Hadoop之上的开源数据仓库系统，可以将存储在Hadoop文件中的结构化、

hive

hadoop

数据分析

大数据

数据仓库

原创精选 2023-06-10 05:37:35 1673 阅读 1点赞 1收藏

3、hive的使用示例详解-建表、数据类型详解、内部外部表、分区表、分桶表

数据定义语言 (Data Definition Language, DDL)，是SQL语言集中对数据库内部的对象结构进行创建，删除，修改等的操作语言，这些数据库对象包括database（schema）、table、view、index等。核心语法由CREATE、ALTER与DROP三个所组成。DDL并不涉及表内部数

hive

大数据

数据分析

数据仓库

hadoop

原创 2023-06-10 05:36:51 1025 阅读 1点赞 1收藏

4、hive的使用示例详解-事务表、视图、物化视图、DDL(数据库、表以及分区)管理详细操作

Hive中的视图（view）是一种虚拟表，只保存定义，不实际存储数据。通常从真实的物理表查询中创建生成视图

hive

数据库

hadoop

数据仓库

大数据

原创 2023-06-10 05:36:06 1304 阅读 1点赞 1收藏

7、hive shell客户端与属性配置、内置运算符、函数（内置运算符与自定义UDF运算符）

通过show functions命令在hive客户端查看当下可用的所有函数；通过describe function extended funcname命令在hive客户端查

hive

hadoop

大数据

数据分析

数据仓库

原创 2023-06-10 05:35:53 245 阅读 1点赞 1收藏

6、hive的select（GROUP BY、ORDER BY、CLUSTER BY、SORT BY、LIMIT、union、CTE）、join使用详解及示例

order by全局排序，因此只有一个reducer，结果输出在一个文件中，当输入规模大时，需要

hive

大数据

数据分析

hadoop

数据仓库

原创精选 2023-06-10 05:34:53 1201 阅读 1点赞 1收藏

9、hive的explode、Lateral View侧视图、聚合函数、窗口函数、抽样函数使用详解

1、apache-hive-3.1.2简介及部署（三种部署方式-内嵌模式、本地模式和远程模式）及验证详解2、hive相关概念详解

hive

hadoop

大数据

数据仓库

数据分析

原创 2023-06-10 05:34:31 1598 阅读 1点赞 1收藏

8、hive的关系运算、逻辑预算、数学运算、数值运算、日期函数、条件函数和字符串函数的语法与使用示例详解

详细的介绍了hive的关系运算、逻辑预算、数学运算、数值运算、日期函数、条件函数和字符串

hive

hadoop

大数据

数据仓库

数据分析

原创 2023-06-10 05:33:41 439 阅读 1点赞 1收藏

10、hive综合示例：数据多分隔符（正则RegexSerDe）、url解析、行列转换常用函数（case when、union、concat和explode）详细使用示例

Hive中也允许使用自定义InputFormat来解决以上问题，通过在自定义InputFormat，来自定义解析逻辑实现读取每一行的数据。

hive

hadoop

大数据

数据仓库

数据分析

原创精选 2023-06-10 05:33:25 1332 阅读 1点赞 1收藏

11、hive综合应用示例：json解析、窗口函数应用（连续登录、级联累加、topN）、拉链表应用

拉链表的设计是将更新的数据进行状态记录，没有发生更新的数据不进行状态存储，用于存储所有数

hive

hadoop

大数据

数据分析

数据仓库

原创 2023-06-10 05:32:40 408 阅读 1点赞 1收藏

12、Hive优化-文件存储格式和压缩格式优化与job执行优化（执行计划、MR属性、join、优化器、谓词下推和数据倾斜优化）详细介绍及示例

Hive数据存储的本质还是HDFS，所有的数据读写都基于HDFS的文件来实现；为了提高对HDFS文件读写的性能，Hive提供了多种文件存储格式：TextFile、SequenceFile、ORC、Parquet等；不同的文件存储格式具有不同的存储特点，有的可以降低存储空间

hive

hadoop

数据分析

数据仓库

大数据

原创 2023-06-10 05:32:25 855 阅读 1点赞 1收藏

13、java api访问hive操作示例

本文依赖hive环境可用，特别是HiveServer2。本文仅仅介绍通过java api访问hive的数据。

hive

java

hadoop

数据仓库

数据分析

原创 2023-06-10 05:32:03 95 阅读 1点赞 1收藏

13、java api访问hive操作示例

Apache Hive 系列文章 1、apache-hive-3.1.2简介及部署（三种部署方式-内嵌模式、本地模式和远程模式）及验证详解 2、hive相关概念详解--架构、读写文件机制、数据存储 3、hive的使用示例详解-建表、数据类型详解、内部外部表、分区表、分桶表 4、hive的使用示例详解-事务表、视图、物化视图、DDL(数据库、表以及分区)管理详细操作 5、hive的load、inse

hive

hadoop

大数据

数据仓库

数据分析

原创 2023-06-08 16:45:32 229 阅读 1点赞 1收藏 yyds干货盘点

12、Hive优化-文件存储格式和压缩格式优化与job执行优化（执行计划、MR属性、join、优化器、谓词下推和数据倾斜优化）详细介绍及示例

Apache Hive 系列文章 1、apache-hive-3.1.2简介及部署（三种部署方式-内嵌模式、本地模式和远程模式）及验证详解 2、hive相关概念详解--架构、读写文件机制、数据存储 3、hive的使用示例详解-建表、数据类型详解、内部外部表、分区表、分桶表 4、hive的使用示例详解-事务表、视图、物化视图、DDL(数据库、表以及分区)管理详细操作 5、hive的load、inse

hive

hadoop

大数据

数据仓库

数据分析

原创精选 2023-06-08 16:32:55 949 阅读 1点赞 1收藏 yyds干货盘点

11、hive综合应用示例：json解析、窗口函数应用（连续登录、级联累加、topN）、拉链表应用

Apache Hive 系列文章 1、apache-hive-3.1.2简介及部署（三种部署方式-内嵌模式、本地模式和远程模式）及验证详解 2、hive相关概念详解--架构、读写文件机制、数据存储 3、hive的使用示例详解-建表、数据类型详解、内部外部表、分区表、分桶表 4、hive的使用示例详解-事务表、视图、物化视图、DDL(数据库、表以及分区)管理详细操作 5、hive的load、inse

hive

hadoop

大数据

数据分析

数据仓库

原创 2023-06-08 14:47:09 517 阅读 1点赞 1收藏 yyds干货盘点

10、hive综合示例：数据多分隔符（正则RegexSerDe）、url解析、行列转换常用函数（case when、union、concat和explode）详细使用示例

Apache Hive 系列文章 1、apache-hive-3.1.2简介及部署（三种部署方式-内嵌模式、本地模式和远程模式）及验证详解 2、hive相关概念详解--架构、读写文件机制、数据存储 3、hive的使用示例详解-建表、数据类型详解、内部外部表、分区表、分桶表 4、hive的使用示例详解-事务表、视图、物化视图、DDL(数据库、表以及分区)管理详细操作 5、hive的load、inse

hive

hadoop

大数据

数据分析

数据仓库

原创 2023-06-08 14:46:34 793 阅读 1点赞 1收藏 yyds干货盘点

9、hive的explode、Lateral View侧视图、聚合函数、窗口函数、抽样函数使用详解

Apache Hive 系列文章 1、apache-hive-3.1.2简介及部署（三种部署方式-内嵌模式、本地模式和远程模式）及验证详解 2、hive相关概念详解--架构、读写文件机制、数据存储 3、hive的使用示例详解-建表、数据类型详解、内部外部表、分区表、分桶表 4、hive的使用示例详解-事务表、视图、物化视图、DDL(数据库、表以及分区)管理详细操作 5、hive的load、inse

hive

聚合函数

大数据

数据仓库

数据分析

原创精选 2023-06-07 14:32:27 694 阅读 2点赞 1收藏 yyds干货盘点

8、hive的关系运算、逻辑预算、数学运算、数值运算、日期函数、条件函数和字符串函数的语法与使用示例详解

Apache Hive 系列文章 1、apache-hive-3.1.2简介及部署（三种部署方式-内嵌模式、本地模式和远程模式）及验证详解 2、hive相关概念详解--架构、读写文件机制、数据存储 3、hive的使用示例详解-建表、数据类型详解、内部外部表、分区表、分桶表 4、hive的使用示例详解-事务表、视图、物化视图、DDL(数据库、表以及分区)管理详细操作 5、hive的load、inse

hive

hadoop

数据仓库

数据分析

大数据

原创 2023-06-07 10:34:09 524 阅读 1点赞 1收藏 yyds干货盘点

7、hive shell客户端与属性配置、内置运算符、函数（内置运算符与自定义UDF运算符）

Apache Hive 系列文章 1、apache-hive-3.1.2简介及部署（三种部署方式-内嵌模式、本地模式和远程模式）及验证详解 2、hive相关概念详解--架构、读写文件机制、数据存储 3、hive的使用示例详解-建表、数据类型详解、内部外部表、分区表、分桶表 4、hive的使用示例详解-事务表、视图、物化视图、DDL(数据库、表以及分区)管理详细操作 5、hive的load、inse

hive

hadoop

数据仓库

数据分析

大数据

原创精选 2023-06-07 10:33:18 341 阅读 1点赞 1收藏 yyds干货盘点

6、hive的select（GROUP BY、ORDER BY、CLUSTER BY、SORT BY、LIMIT、union、CTE）、join使用详解及示例

Apache Hive 系列文章 1、apache-hive-3.1.2简介及部署（三种部署方式-内嵌模式、本地模式和远程模式）及验证详解 2、hive相关概念详解--架构、读写文件机制、数据存储 3、hive的使用示例详解-建表、数据类型详解、内部外部表、分区表、分桶表 4、hive的使用示例详解-事务表、视图、物化视图、DDL(数据库、表以及分区)管理详细操作 5、hive的load、inse

hive

hadoop

大数据

数据分析

数据仓库

原创 2023-06-06 16:26:44 334 阅读 1点赞 1收藏 yyds干货盘点

5、hive的load、insert、事务表使用详解及示例

Apache Hive 系列文章 1、apache-hive-3.1.2简介及部署（三种部署方式-内嵌模式、本地模式和远程模式）及验证详解 2、hive相关概念详解--架构、读写文件机制、数据存储 3、hive的使用示例详解-建表、数据类型详解、内部外部表、分区表、分桶表 4、hive的使用示例详解-事务表、视图、物化视图、DDL(数据库、表以及分区)管理详细操作 5、hive的load、inse

hive

hadoop

大数据

数据仓库

数据分析

原创 2023-06-06 16:26:05 907 阅读 1点赞 1收藏 yyds干货盘点

4、hive的使用示例详解-事务表、视图、物化视图、DDL(数据库、表以及分区)管理详细操作

Apache Hive 系列文章 1、apache-hive-3.1.2简介及部署（三种部署方式-内嵌模式、本地模式和远程模式）及验证详解 2、hive相关概念详解--架构、读写文件机制、数据存储 3、hive的使用示例详解-建表、数据类型详解、内部外部表、分区表、分桶表 4、hive的使用示例详解-事务表、视图、物化视图、DDL(数据库、表以及分区)管理详细操作 5、hive的load、inse

hive

hadoop

大数据

数据仓库

数据分析

原创 2023-06-06 16:25:25 599 阅读 1点赞 1收藏 yyds干货盘点

3、hive的使用示例详解-建表、数据类型详解、内部外部表、分区表、分桶表

Apache Hive 系列文章 1、apache-hive-3.1.2简介及部署（三种部署方式-内嵌模式、本地模式和远程模式）及验证详解 2、hive相关概念详解--架构、读写文件机制、数据存储 3、hive的使用示例详解-建表、数据类型详解、内部外部表、分区表、分桶表 4、hive的使用示例详解-事务表、视图、物化视图、DDL(数据库、表以及分区)管理详细操作 5、hive的load、inse

Hive

hadoop

大数据

数据仓库

数据分析

原创精选 2023-06-06 16:24:39 542 阅读 1点赞 1收藏 yyds干货盘点

2、hive相关概念详解--架构、读写文件机制、数据存储

Apache Hive 系列文章 1、apache-hive-3.1.2简介及部署（三种部署方式-内嵌模式、本地模式和远程模式）及验证详解 2、hive相关概念详解--架构、读写文件机制、数据存储 3、hive的使用示例详解-建表、数据类型详解、内部外部表、分区表、分桶表 4、hive的使用示例详解-事务表、视图、物化视图、DDL(数据库、表以及分区)管理详细操作 5、hive的load、inse

hive

hadoop

大数据

数据仓库

数据分析

原创精选 2023-06-06 16:23:05 559 阅读 1点赞 1收藏 yyds干货盘点

1、apache-hive-3.1.2简介及部署（三种部署方式-内嵌模式、本地模式和远程模式）及验证详解

Apache Hive 系列文章 1、apache-hive-3.1.2简介及部署（三种部署方式-内嵌模式、本地模式和远程模式）及验证详解 2、hive相关概念详解--架构、读写文件机制、数据存储 3、hive的使用示例详解-建表、数据类型详解、内部外部表、分区表、分桶表 4、hive的使用示例详解-事务表、视图、物化视图、DDL(数据库、表以及分区)管理详细操作 5、hive的load、inse

hive

hadoop

数据仓库

大数据

数据分析

原创精选 2023-06-06 16:22:14 871 阅读 1点赞 1收藏

1、通过亿级数据量在hive和impala中查询比较text、orc和parquet性能表现（二）

二篇是查询比较。本文是第二篇。本文接。

hadoop

kafka

flink

hive

大数据

原创 2023-05-15 17:55:09 851 阅读 1点赞 1收藏

1、通过亿级数据量在hive和impala中查询比较text、orc和parquet性能表现（一）

文章目录一、结论二、三种文件简单介绍1、parquet2、text3、orc三、需求四、实现步骤五、实现1、创建topic2、写入kafka topic t_kafka_flink_user 1亿条数据1）、pom.xml2)、代码1、bean2、生产者3）、验证3、将kafka topic t_kafka_flink_user中的数据经过flink转换存入mysql1）、pom.xml2)、代

hadoop

hive

flink

kafka

sqoop

原创 2023-05-15 17:12:23 414 阅读 1点赞 1收藏

2、sqoop导入（RMDB-mysql、sybase到HDFS-hive）

导入工具”导入单个表从RDBMS到HDFS。表中的每一行被视为HDFS的记录。所有记录都存储为文本文件的文本数据导入数据目录可以发现多了一个文件里面就是增量数据。

hive

mysql

hdfs

大数据

sqoop

原创 2023-05-15 17:12:17 615 阅读 1点赞 1收藏

1、Apache Sqoop介绍及部署

sqoop

hadoop

hive

big data

大数据

原创 2023-05-15 17:10:05 351 阅读 1点赞 1收藏

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

51CTO博客

alanchan的博客

欢迎

5、hive的load、insert、事务表使用详解及示例

2、hive相关概念详解--架构、读写文件机制、数据存储

1、apache-hive-3.1.2简介及部署（三种部署方式-内嵌模式、本地模式和远程模式）及验证详解

3、hive的使用示例详解-建表、数据类型详解、内部外部表、分区表、分桶表

4、hive的使用示例详解-事务表、视图、物化视图、DDL(数据库、表以及分区)管理详细操作

7、hive shell客户端与属性配置、内置运算符、函数（内置运算符与自定义UDF运算符）

6、hive的select（GROUP BY、ORDER BY、CLUSTER BY、SORT BY、LIMIT、union、CTE）、join使用详解及示例

9、hive的explode、Lateral View侧视图、聚合函数、窗口函数、抽样函数使用详解

8、hive的关系运算、逻辑预算、数学运算、数值运算、日期函数、条件函数和字符串函数的语法与使用示例详解

10、hive综合示例：数据多分隔符（正则RegexSerDe）、url解析、行列转换常用函数（case when、union、concat和explode）详细使用示例

11、hive综合应用示例：json解析、窗口函数应用（连续登录、级联累加、topN）、拉链表应用

12、Hive优化-文件存储格式和压缩格式优化与job执行优化（执行计划、MR属性、join、优化器、谓词下推和数据倾斜优化）详细介绍及示例

13、java api访问hive操作示例

13、java api访问hive操作示例

12、Hive优化-文件存储格式和压缩格式优化与job执行优化（执行计划、MR属性、join、优化器、谓词下推和数据倾斜优化）详细介绍及示例

11、hive综合应用示例：json解析、窗口函数应用（连续登录、级联累加、topN）、拉链表应用

10、hive综合示例：数据多分隔符（正则RegexSerDe）、url解析、行列转换常用函数（case when、union、concat和explode）详细使用示例

9、hive的explode、Lateral View侧视图、聚合函数、窗口函数、抽样函数使用详解

8、hive的关系运算、逻辑预算、数学运算、数值运算、日期函数、条件函数和字符串函数的语法与使用示例详解

7、hive shell客户端与属性配置、内置运算符、函数（内置运算符与自定义UDF运算符）

6、hive的select（GROUP BY、ORDER BY、CLUSTER BY、SORT BY、LIMIT、union、CTE）、join使用详解及示例

5、hive的load、insert、事务表使用详解及示例

4、hive的使用示例详解-事务表、视图、物化视图、DDL(数据库、表以及分区)管理详细操作

3、hive的使用示例详解-建表、数据类型详解、内部外部表、分区表、分桶表

2、hive相关概念详解--架构、读写文件机制、数据存储

1、apache-hive-3.1.2简介及部署（三种部署方式-内嵌模式、本地模式和远程模式）及验证详解

1、通过亿级数据量在hive和impala中查询比较text、orc和parquet性能表现（二）

1、通过亿级数据量在hive和impala中查询比较text、orc和parquet性能表现（一）

2、sqoop导入（RMDB-mysql、sybase到HDFS-hive）

1、Apache Sqoop介绍及部署