1.文档编写目的


Tableau是桌面系统中的商业智能工具软件,可以基于不同的数据源生成漂亮的图表。Cloudera与Tableau是互相认证的合作伙伴,在Tableau的数据源配置界面可以直接找到“Cloudera Hadoop”,从而让你很方便的进行安装配置。

本文主要介绍Tableau Desktop的安装,Hive/Impala的ODBC驱动的安装,配置Tableau连接CDH以及生成你第一个图表。

  • 内容概述

1.Tableau Desktop下载安装

2.Hive/Impala的ODBC驱动下载安装

3.配置Tableau连接Hive/Impala

  • 测试环境

1.CDH5.13

2.Tableau Desktop 10.4

3.Windows Server 2008 R2,64位

4.集群未启用Kerberos

2.Tableau Desktop下载安装


1.下载Tableau Desktop的安装软件

下载地址:

Start your free trial of Tableau

dbever 连接hive hive odbc连接_hive

等待下载完成

dbever 连接hive hive odbc连接_hive_02

2.双击安装程序,安装Tableau Desktop

dbever 连接hive hive odbc连接_hive_03

dbever 连接hive hive odbc连接_hive_04

3.等待安装完成可以看到主界面

dbever 连接hive hive odbc连接_big data_05

3.下载并安装Hive的ODBC驱动


1.下载Hive的ODBC驱动

下载地址为:

Download Hive ODBC Driver 2.5.24

2.5.24为目前最新版本,根据你的操作系统的实际情况选择,Fayson的电脑是Windows的系统,64位。

dbever 连接hive hive odbc连接_big data_06

2.安装Hive的ODBC驱动

双击下载好的msi文件安装

dbever 连接hive hive odbc连接_Hive_07

dbever 连接hive hive odbc连接_hive_08

dbever 连接hive hive odbc连接_big data_09

dbever 连接hive hive odbc连接_Hive_10

dbever 连接hive hive odbc连接_数据库_11

4.下载并安装Impala的ODBC驱动


1.下载Impala的ODBC驱动

下载地址为:

Download Impala ODBC Connector 2.5.40

2.5.40为目前最新版本,根据你的操作系统的实际情况选择,Fayson的电脑是Windows的系统,64位。

dbever 连接hive hive odbc连接_数据库_12

2.安装Impala的ODBC驱动

双击下载好的msi文件进行安装

dbever 连接hive hive odbc连接_hive_13

dbever 连接hive hive odbc连接_数据库_14

dbever 连接hive hive odbc连接_big data_15

dbever 连接hive hive odbc连接_Hive_16

dbever 连接hive hive odbc连接_数据库_17

5.配置Hive的ODBC连接并测试


1.进入ODBC管理界面

dbever 连接hive hive odbc连接_dbever 连接hive_18

dbever 连接hive hive odbc连接_数据库_19

2.点击Add,选择Hive,点击Finish

dbever 连接hive hive odbc连接_Hive_20

3.弹出配置界面,输入HiveServer2的地址,因为Fayson的集群未启用Kerberos,Authentication选择“User Name”,随便输入一个用户hive。

dbever 连接hive hive odbc连接_数据库_21

4.点击“Test”

dbever 连接hive hive odbc连接_hive_22

5.点击OK,并保存,完成配置。

dbever 连接hive hive odbc连接_big data_23

6.使用Tableau连接Hive


1.进入Tableau的界面点击“more”,从而选择更多数据源

dbever 连接hive hive odbc连接_big data_24

2.选择Cloudera Hadoop

dbever 连接hive hive odbc连接_dbever 连接hive_25

3.输入CDH集群的HiveServer2的地址,因为Fayson的CDH5.13未启用Kerberos,所以Authentication选择“Username”,Username输入hive。然后点击“Sigh In”

dbever 连接hive hive odbc连接_big data_26

4.进入Tableau

dbever 连接hive hive odbc连接_数据库_27

5.注意这里还看不到Hive中的database以及table,点击左侧“Schema”的下拉箭头。

dbever 连接hive hive odbc连接_Hive_28

6.点击“+”号旁边的放大镜符号,会搜索出default数据库

dbever 连接hive hive odbc连接_Hive_29

7.双击default

dbever 连接hive hive odbc连接_数据库_30

8.再次点击“+”号旁边的放大镜符号,会搜索出default数据库内的所有表

dbever 连接hive hive odbc连接_hive_31

9.双击test_table选中这张表

dbever 连接hive hive odbc连接_big data_32

10.点击底部的Sheet1,进入图表创建界面

dbever 连接hive hive odbc连接_Hive_33

dbever 连接hive hive odbc连接_big data_34

11.Columns那里输入sum(s1),这时Tableau会去后端找Hive读取数据,需要一段时间

dbever 连接hive hive odbc连接_数据库_35

12.Rows那里输入s2,这时Tableau会去后端找Hive读取数据,同样需要一段时间。这时你第一个图表就生成了。

dbever 连接hive hive odbc连接_Hive_36

13.附上Hive中的这张表的数据供大家参考

dbever 连接hive hive odbc连接_big data_37

7.配置Impala的ODBC连接并测试


1.进入ODBC管理界面

dbever 连接hive hive odbc连接_big data_38

dbever 连接hive hive odbc连接_Hive_39

2.点击Add,并选择Impala,然后点击Finish

dbever 连接hive hive odbc连接_dbever 连接hive_40

3.弹出配置界面,输入HiveServer2的地址,因为Fayson的集群未启用Kerberos,Authentication选择“No Authentication”。

dbever 连接hive hive odbc连接_hive_41

4.点击Test

dbever 连接hive hive odbc连接_dbever 连接hive_42

5.点击OK,并保存。

dbever 连接hive hive odbc连接_Hive_43

8.使用Tableau连接Impala


1.进入Tableau的界面点击“more”,从而选择更多数据源

dbever 连接hive hive odbc连接_big data_44

2.选择Cloudera Hadoop

dbever 连接hive hive odbc连接_dbever 连接hive_45

3.选择一台Impala Daemon的机器,将端口改为21050,Type选择Impala,因为Fayson的机器没有启用Kerberos,Authentication选择为“No Authentication”。点击“Sign In”

dbever 连接hive hive odbc连接_hive_46

4.后面的操作与Hive一样,Fayson不再赘述,只是Impala的相应会更快一些,生成同样的图表如下。

dbever 连接hive hive odbc连接_hive_47