前言

本文讲解如何通过数据库客户端界面工具DBeaver连接hive,并解决驱动下载不下来的问题。

1、为什么使用客户端界面工具

为什么使用客户端界面工具而不用命令行使用hive

  • 通过界面工具查看分析hive里的数据要方便很多
  • 业务人员没有权限通过命令行连接hive
  • 领导喜欢在界面工具上查看hive里的数据

2、为什么使用DBeaver

其实在网上搜一下,连接hive的工具还有很多,使用DBeaver的原因是因为我之前连接关系型数据库使用的就是DBeaver,正好DBeaver支持连接hive,且个人认为DBeaver确实挺好用的,支持各种关系型数据库,如连接Oracle数据库不需要像plsql那样自己配置连接文件,只需要在界面上输入url、用户名、密码即可,还有就是DBeaver的快捷键和Eclipse是一样的,比如注释、删除一行、复制一行到下一行等。

3、DBeaver下载、安装

之前我一直用的旧版的,现在在官网上下载了最新版的DBeaver,发现界面功能比旧版好用了很多,亲测连hive没有问题。

下载地址:https://dbeaver.io/download/ 我下载的免安装版(不带jre),windows64位,大家可以根据自己情况下载对应版本。

hive cli客户端 java api hive客户端工具_数据库


4、DBeaver连接hive

DBeaver连接关系型数据库比较的简单,连接hive的话因为要配置下载驱动,所以这里详细说明一下。

6.1 文件->新建->数据库连接

hive cli客户端 java api hive客户端工具_数据库_02

6.2 选择新连接类型->Apache Hive(从这里看到,DBeaver支持的数据库还是很多的)

hive cli客户端 java api hive客户端工具_hive_03

6.3 填一下hiveserver2的ip和hive的数据库名

hive cli客户端 java api hive客户端工具_数据库_04

6.4 编辑驱动设置-下载/更新(第一次打开需要下载maven的依赖配置,需等待一会)

hive cli客户端 java api hive客户端工具_数据库_05

这里需等待一会,截图太多,记不清楚是不是这个图了~

hive cli客户端 java api hive客户端工具_hive_06

6.5 选择hive的版本,我这里的版本为2.3.2

到这里就有问题了,之前我在公司的测试机用ambari装的hive的版本是1.2.1,然后下载1.2.1需要的hive的jar包,很快就下载下来了,之后就可以查询hive里的数据了,但是在自己的虚拟机版本为2.3.2,2.3.2的jar就下不下来了

hive cli客户端 java api hive客户端工具_hadoop_07


hive cli客户端 java api hive客户端工具_hadoop_08

尝试将maven库改为阿里云的无效,且测试和DBeaver的版本无关,旧版和最新版的都下载不下来

hive cli客户端 java api hive客户端工具_hive_09

7、用hive自带的jdbc jar

多次尝试依然解决不了驱动下载不下来的问题,只能尝试用hive安装包自带的jdbc jar了,幸好DBeaver和hive很好的支持了这种方法。hive帮我们集成了jdbc相关的一个jar包,这样我们就不用一个一个去lib下找相关的jar包了~
首先将hive安装包里的jdbc包下载到本地,jar包位置:

/opt/apache-hive-2.3.2-bin/jdbc/hive-jdbc-2.3.2-standalone.jar


然后将DBeaver默认的jar删除,再添加上我们刚才下载的jar包,然后下一步,命名我们的连接。

hive cli客户端 java api hive客户端工具_hadoop_10


hive cli客户端 java api hive客户端工具_数据库_11


hive cli客户端 java api hive客户端工具_hive_12

8、测试连接

右键连接名->编辑连接->测试连接,然后发现报了一个异常

hive cli客户端 java api hive客户端工具_hive_13


hive cli客户端 java api hive客户端工具_数据库_14

9、解决异常

但是在ambari安装的hive上测试这种方法是没有问题的,经过网上查询该异常,发现是我的hdfs配置问题,修改hdfs的core-site.xml即可
先关掉hdfs、yarn、hiveserver2服务

vim /opt/hadoop-2.7.5/etc/hadoop/core-site.xml
  • 1

添加

<property>
    <name>hadoop.proxyuser.root.hosts</name>
    <value>*</value>
</property>
<property>
    <name>hadoop.proxyuser.root.groups</name>
    <value>*</value>
</property>

然后重启hdfs、yarn、hiveserver2
具体可参考[Hive]那些年我们踩过的Hive坑里的第十个异常。

10、再次测试

再次测试连接,成功!

hive cli客户端 java api hive客户端工具_hive_15

从这里可以看出DBeaver的界面功能还是挺丰富的,使用起来也比较方便


前言

本文讲解如何通过数据库客户端界面工具DBeaver连接hive,并解决驱动下载不下来的问题。

1、为什么使用客户端界面工具

为什么使用客户端界面工具而不用命令行使用hive

  • 通过界面工具查看分析hive里的数据要方便很多
  • 业务人员没有权限通过命令行连接hive
  • 领导喜欢在界面工具上查看hive里的数据

2、为什么使用DBeaver

其实在网上搜一下,连接hive的工具还有很多,使用DBeaver的原因是因为我之前连接关系型数据库使用的就是DBeaver,正好DBeaver支持连接hive,且个人认为DBeaver确实挺好用的,支持各种关系型数据库,如连接Oracle数据库不需要像plsql那样自己配置连接文件,只需要在界面上输入url、用户名、密码即可,还有就是DBeaver的快捷键和Eclipse是一样的,比如注释、删除一行、复制一行到下一行等。

3、DBeaver下载、安装

之前我一直用的旧版的,现在在官网上下载了最新版的DBeaver,发现界面功能比旧版好用了很多,亲测连hive没有问题。

下载地址:https://dbeaver.io/download/ 我下载的免安装版(不带jre),windows64位,大家可以根据自己情况下载对应版本。

hive cli客户端 java api hive客户端工具_数据库