链接:https://pan.baidu.com/s/1aE4CwIRG4hZPwlbKcdgv_w
提取码:5sxa

安装包,百度网盘。

其中hbase0.98版本太低,不建议使用。可以使用1.2.6版本。如果遇到版本冲突问题,在考虑使用。

zookeeper安装:

上传安装包:解压安装包,创建软连接:**创建软连接是为了方便。

解压命令:tar -zxvf 文件 ******解压到当前目录。

hadoop用完后要断开 hadoop需要zookeeper吗_hadoop

配置zookeeper的conf目录下文件:

将zoo_sample.cfg文件复制并重命名为zoo.cfg*

hadoop用完后要断开 hadoop需要zookeeper吗_hadoop_02


环境变量最下面的PATH是以‘:’分割,指示安装包目录下的bin目录,
HADOOP_HOME的bin目录名为sbin所以为:$HADOOP_HOME/bin:,
结尾以:与PATH分割。记得‘配置PATH前后每个路径前后以:分割,开头有$符号。

=============================

配置zookeeper的环境变量:

hadoop用完后要断开 hadoop需要zookeeper吗_大数据_03

配置文件立即生效:
source /etc/profile

启动测试:

zookeeper/bin]#./zkServer.sh start

hadoop用完后要断开 hadoop需要zookeeper吗_kylin_04


zookeeper安装完成。

==================================
2.安装Hbase:
上传安装包:解压,创建软连接:

hadoop用完后要断开 hadoop需要zookeeper吗_hadoop_05

配置Hbase的conf目录下文件:
修改hbase-env.sh文件,修改内容如下:

hadoop用完后要断开 hadoop需要zookeeper吗_kylin_06


记得修改为自己的jdk所在地址修改hbase-site.xml文件,添加内容如下:

hadoop用完后要断开 hadoop需要zookeeper吗_hive_07

IP修改为自己的IP地址或者自己的主机名字,端口号不要修改,第二个目录如果没有,请手动创建,最后的hbase.zookeeper.quorum修改为自己的IP或者主机名字。

remeber

<property>
    <name>hbase.rootdir</name>
    <value>hdfs://192.168.73.131:9000/hbase</value>
</property>
<property>
    <name>hbase.tmp.dir</name>
    <value>/home/centos/software/hbase/tmp</value>  
</property>  
<property>
    <name>hbase.cluster.distributed</name>
    <value>true</value>
</property>
<property> 
   <name>hbase.zookeeper.quorum</name>
   <value>192.168.73.131</value>
</property>

修改hbase-env.sh文件,修改内容如下:

hadoop用完后要断开 hadoop需要zookeeper吗_hive_08


改为false是因为zookeeper有自带的运行程序,但是俺们不用,要用自己搞的,所以改为false.配置Hbase的环境变量:

hadoop用完后要断开 hadoop需要zookeeper吗_hive_09

配置文件立即生效:
source /etc/profile

启动测试hbase:
首先启动Hadoop和zookeeper,然后再启动hbase:

hbase/bin]#./start-hbase.sh

hadoop用完后要断开 hadoop需要zookeeper吗_hive_10


网页访问hbase:

http://node:16010/master-status node修改为自己的IP地址

hadoop用完后要断开 hadoop需要zookeeper吗_hadoop用完后要断开_11


关闭Hbase:

hbase/bin]#./stop-hbase.sh

hadoop用完后要断开 hadoop需要zookeeper吗_大数据_12

*只是展示一下命令,启动kylin要组件进程运行。

hbase安装完成

进入hbase命令行命令:hbase shell


================
Hive的安装

Hive安装之前保证虚拟机上的Hadoop可以正常使用,并且已经安装了mysql。

hadoop用完后要断开 hadoop需要zookeeper吗_hive_13


hadoop用完后要断开 hadoop需要zookeeper吗_kylin_14


hadoop用完后要断开 hadoop需要zookeeper吗_大数据_15


Hive使用自带的关系型数据库derby,会将hive的元数据信息保存在derby中,但是存在一定缺陷:如果在某个目录下使用客户端,则会在相应的目录下创建元数据库保存元数据,如果更换目录则查询不到。 所以我们将更换mysql作为hive的元数据信息保存的数据库。

hadoop用完后要断开 hadoop需要zookeeper吗_hive_16

hadoop用完后要断开 hadoop需要zookeeper吗_hive_17


更换mysql作为hive的元数据信息保存的数据库;在mysql中创建hive库:

create database hive character set latin1;

hadoop用完后要断开 hadoop需要zookeeper吗_大数据_18

hadoop用完后要断开 hadoop需要zookeeper吗_kylin_19

hadoop用完后要断开 hadoop需要zookeeper吗_hadoop_20

hadoop用完后要断开 hadoop需要zookeeper吗_大数据_21

<configuration> 
<property> 
       <name>javax.jdo.option.ConnectionURL</name> 
       <value>jdbc:mysql://node31(修改为自己的主机名字或者IP号):3306/hive?createDatabaseIfNotExist=true</value>        			       </property>
 <property> 
                <name>javax.jdo.option.ConnectionDriverName</name> 
                <value>com.mysql.jdbc.Driver</value> 
</property> 
 <property> 
                <name>javax.jdo.option.ConnectionUserName</name> 
                <value>root</value>
</property> 
 <property>  
               <name>javax.jdo.option.ConnectionPassword</name>   
		<value>root(修改为自己的mysql登录密码)</value>
  </property> 
  </configuration>

如果如何成功修改文件不会退出,参考此图:

hadoop用完后要断开 hadoop需要zookeeper吗_hive_22


hadoop用完后要断开 hadoop需要zookeeper吗_kylin_23

运行的时候会出现一堆的乱码,莫慌,是因为mysql的驱动包版本低,如果有空换一个。

hadoop用完后要断开 hadoop需要zookeeper吗_hadoop_24


hive安装成功。

jdbc连接方式

使用JDBC方式连接使用hive;

启动hive服务端:
./hive --service hiveserver2 &

JDBC连接hive服务端:
./hive --service beeline -u jdbc:hive2://node51:10000 -n root

JDBC连接退出hive:!exit

hadoop用完后要断开 hadoop需要zookeeper吗_大数据_25

[

hadoop用完后要断开 hadoop需要zookeeper吗_kylin_26


hadoop用完后要断开 hadoop需要zookeeper吗_hadoop用完后要断开_27


安装过程可能存在的问题

1. mysql没有配置用户名和密码。
2. Mysql的权限没开放
3…忘记导入mysql的驱动包到hive的lib目录下。
4.Mysql创建hive库不是latin1。
5.hive-site.xml文件配置错误。
6. JDBC方式连接没有加上用户名(-n root)

配置hive的环境变量:

编辑/etc/profile添加如下内容:

hadoop用完后要断开 hadoop需要zookeeper吗_hadoop_28

kylin安装:

上传安装包:解压,并创建软连接:

hadoop用完后要断开 hadoop需要zookeeper吗_大数据_29


配置环境变量:

hadoop用完后要断开 hadoop需要zookeeper吗_hadoop_30

生效文件:source /etc/profile

启动测试:
Hadoop( start-all.sh )
Hive(./bin/hive --service hiveserver2 & )
Zookeeper ( zkServer.sh start )
Hbase( start-hbase.sh )

启动kylin:

./bin/kylin.sh start

hadoop用完后要断开 hadoop需要zookeeper吗_hive_31


hadoop用完后要断开 hadoop需要zookeeper吗_kylin_32


kylin启动需要时间,请耐心一点。

hadoop用完后要断开 hadoop需要zookeeper吗_hive_33


如果显示这个,就是你的环境变量没有配好,请认真检查。环境变量指导在文章开头安装zookeeper有指导内容。网页访问:

hadoop用完后要断开 hadoop需要zookeeper吗_hive_34

用户名:ADMIN
密码:KYLIN

关闭kylin:

kylin.sh stop

Kylin 使用时,将元数据保存在hbase中的,所以在安装使用kylin之前,要把hbase安装好。,使用zookeeper管理hbase,所以先安装zookeeper,然后安装hbase,最后安装kylin。如果进程全部存在,而网页不能访问,调一下虚拟机的内存吧1G调成2G,也许能解决问题