Hive环境搭建

  • 一、准备工作
  • 1.安装包下载
  • 2.虚拟机需先安装好hadoop
  • 3.安装mysql
  • 二、安装hive
  • 三、配置环境变量
  • 1.配置环境变量
  • 2.修改hive配置文件
  • 四、启动hive
  • 1.需先初始化数据库
  • 2.启动hive(该打开的服务要打开)
  • 3.启动第三方插件beeline


一、准备工作

1.安装包下载

因为Hive默认的数据库是derby,不支持同时开启两个./hive的命令终端,

而将Hive的默认数据库修改成mysql后,可以解决该问题,并且derby使用不便利,所以此处推荐同时安装mysql

hive源码阅读环境准备 hive环境搭建_hive


链接: https://pan.baidu.com/s/1VgKaSIAOmCnT-uJplBWpHQ 提取码: ebxq

2.虚拟机需先安装好hadoop

参考:

3.安装mysql

参考:

安装完成需要给root用户赋权:

grant all on *.* to root@'%';
flush privileges;

二、安装hive

cd /software  
tar -zxvf hive-1.1.0-cdh5.14.2.tar.gz -C /opt
cd /opt
mv hive-1.1.0-cdh5.14.2/ hive

三、配置环境变量

1.配置环境变量

vi /etc/profile

添加以下内容:

export HIVE_PATH=/opt/hive
export PATH=$PATH:$HIVE_PATH/bin

使环境变量生效:

source /etc/profile

2.修改hive配置文件

①:进入配置文件目录:   cd /opt/hive/conf/ ②:创建文件并添加以下内容:   vi hive-site.xml

<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>
        <property>
                <name>hive.metastore.warehouse.dir</name>
                <value>hdfs://hadoop-1:9000/hive/warehouse</value>
               <description>管理表存储的位置,可以是linux中的目录,也可以是相对于fs.default.name有关的目录</description>
        </property>
        <property>
                <name>hive.metastore.local</name>
                <value>true</value>
        </property>
        <!-- 指定hive元数据存储的MySQL地址 -->
        <property>
                <name>javax.jdo.option.ConnectionURL</name>
                <value>jdbc:mysql://127.0.0.1:3306/hive?createDatabaseIfNotExist=true</value>
        </property>
        <!-- 元数据存储数据库的驱动 -->
        <property>
                <name>javax.jdo.option.ConnectionDriverName</name>
                <value>com.mysql.jdbc.Driver</value>
        </property>
        <!-- 元数据存储数据库的用户名 -->
        <property>
                <name>javax.jdo.option.ConnectionUserName</name>
                <value>root</value>
        </property>
        <!-- 元数据存储数据库的密码,(注:这里是mysql自己root用户的密码) -->
        <property>
                <name>javax.jdo.option.ConnectionPassword</name>
                <value>ok</value>
        </property>
        
        <!-- 后添加的一列属性20201017,远程连接元数据库 -->
		<property>
			<name>hive.metastore.uris</name>
			<value>thrift://192.168.206.129:9083</value>
		</property>
</configuration>

直接粘贴上面代码,只需更改红框位置主机名即可

hive源码阅读环境准备 hive环境搭建_大数据_02


③:新建hive-env.sh文件,添加以下内容:   vi hive-env.sh

export HADOOP_HOME=/opt/hadoop
export HIVE_HOME=/opt/hive
export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop
export HIVE_AUX_JARS_PATH=/opt/hive/lib
export JAVA_HOME=/opt/jdk8
export HIVE_CONF_DIR=/opt/hive/conf

④:修改hive-log4j.properties

mv hive-log4j.properties.template hive-log4j.properties
vi hive-log4j.properties

进入文件后在第20行修改hive日志目录:

hive.log.dir=/opt/hive/logs

⑤:新建配置文件需要的目录:

#新建目录/hive/warehouse
hadoop fs -mkdir -p /hive/warehouse
#赋权,然后在可以在hive中创建表
hadoop fs -chmod 777 /hive
hadoop fs -chmod 777 /hive/warehouse

⑥:将下载好的本地mysql-connector-java-5.1.48-bin.jar包拖拽到虚拟机安装hive根目录之lib目录下

hive源码阅读环境准备 hive环境搭建_大数据_03

⑦:给hive文件赋权:

chmod 777 /opt/hive

四、启动hive

1.需先初始化数据库

schematool -initSchema -dbType mysql

hive源码阅读环境准备 hive环境搭建_hive源码阅读环境准备_04

2.启动hive(该打开的服务要打开)

启动hive前需要先把hadoop相关进程打开,zookeeper(推荐打开),mysql(一定要打开,特别是用beelin连接数据库时,安全防报错)
即启动顺序:
start-all.sh → zkService.sh start → service mysql start → hive --service metastore → hive
启动hive前,还需启动元数据管理(最安全的启动方法,独占一窗口)用的时候最好一直开着,不用的时候按 ctrl+c 直接中断进程即可

hive --service metastore

.另起一窗口,输入: hive ,进入hive命令模式

hive源码阅读环境准备 hive环境搭建_大数据_05


输入: show tables ,显示如下:

hive源码阅读环境准备 hive环境搭建_mysql_06


输入exit退出hive命令行可以在网页hdfs端口(50070)上查看信息

hive源码阅读环境准备 hive环境搭建_mysql_07

3.启动第三方插件beeline

需先启动mysql

service mysql start

需启动hiveserver2 服务,也是进程独占一窗口,用的时候窗口一直开着就好

nohup hive --service hiveserver2 &

新建窗口,启动beeline服务

beeline -u jdbc:hive2://localhost:10000