HBase安装与配置

目录

HBase安装与配置

安装JDK 1.8

步骤1.  创建工作路径

步骤2.  解压安装包

步骤3.  配置环境变量

步骤4.  更新环境变量

步骤5.  验证JDK是否配置成功

主机名配置

步骤1.  编辑主机名

步骤2.  IP地址与主机名映射文件配置

SElinux安全配置

步骤1.  关闭SElinux

步骤4.  SElinux配置强制生效

配置SSH免密码登录

步骤1.  生成秘钥

步骤2.  秘钥分发

步骤3.  验证免密码登录是否配置成功

安装配置Hadoop

步骤1.  解压安装文件

步骤2.  配置Hadoop环境变量

步骤3.  编辑Hadoop配置文件

步骤4.  格式化HDFS

Hadoop运行及测试

步骤1.  启动Hadoop

步骤2.  Web页面测试

安装配置HBase

步骤1.  HBase环境配置

步骤2.  HBase配置及启动

 Hbase基本操作


注意:

1. jdk、hadoop、hbase压缩包自己使用winscp上传,版本不一样的话,在进行配置环境变量以及修改配置文件时,需要改成自己所使用的压缩包版本号

2.格式化文件系统时,如果失败想要重新格式化,需要删除namenode、datanode这两个文件夹里面的所有东西

3.如果实验过程中没出现错误,但在使用jps查看集群是否成功时发现进程没有显示完,可以使用stop-all.sh关闭集群后再次使用start-all.sh开启集群

4.可能在打开hbase shell进行使用的时候,会报错ERROR:Can’t get master address from Zookeeper;znode data == null,虽然启动hadoop和hbase进程成功了,但是实际上,再次输入jps查看进程,就会缺少Hmaster,此时打开终端,输入ifconfig查看你的ip,发现原来的ip地址已经改变或者缺失,此时也需要:stop-all.sh关闭集群后再次使用start-all.sh开启集群

5. 在实验为完成时尽量不要重启虚拟机

6.为了方便,做实验时可以一下把hadoop、jdk、hbase环境变量都配置了

安装JDK 1.8

步骤1.  创建工作路径

首先需要在终端中输入下列命令,在/usr目录下建立cx工作路径:

mkdir /usr/cx

步骤2.  解压安装包

在/usr/software/目录下找到jdk-8u60-linux-x64.tar.gz安装包,通过下列命令将其解压到/usr/cx/目录下,执行如下命令:

tar -zxvf /usr/software/jdk-8u60-linux-x64.tar.gz -C /usr/cx

命令执行后的输出内容如下所示:

hbase 需要什么配置服务器_数据库

步骤3.  配置环境变量

1.   通过下列命令使用vi编辑器打开 ~/.bashrc文件:

vi ~/.bashrc

打开的~/.bashrc文件内容如下所示:

hbase 需要什么配置服务器_数据库_02

2.   在文件中写入下列内容:

export JAVA_HOME=/usr/cx/jdk1.8.0_60
export PATH=$JAVA_HOME/bin:$PATH
export CLASSPATH=.:$JAVA_HOME/jre/lib/rt.jar:$JAVA_HOME/jre/lib/tools.jar

编辑完成后保存文件并退出vi编辑器。

hbase 需要什么配置服务器_linux_03

步骤4.  更新环境变量

执行如下命令,更新环境变量:

source  ~/.bashrc

步骤5.  验证JDK是否配置成功

通过下列命令验证JDK是否安装并配置成功:

java -version

如果出现如下JDK版本信息,则说明安装配置成功:

hbase 需要什么配置服务器_linux_04

主机名配置

步骤1.  编辑主机名

1.   通过下列命令使用vi编辑器编辑主机名配置文件:

vi  /etc/sysconfig/network

打开后的文件内容如下所示:

hbase 需要什么配置服务器_linux_05

 2.   在文件中进行内容更改,将HOSTNAME字段内容配置成master:

HOSTNAME=master

编辑完成后保存文件并退出vi编辑器,更改后的文件内容如下所示:

hbase 需要什么配置服务器_hadoop_06

 3.     更改后的内容会在下次系统重启的时候生效,通过下列命令重新启动系统:

reboot

步骤2.  IP地址与主机名映射文件配置

1.   通过下列命令使用vi编辑器编辑hosts文件:

vi  /etc/hosts

打开后的文件内容如下所示:

hbase 需要什么配置服务器_hbase 需要什么配置服务器_07

2.   增加主机名与IP地址的映射关系:

127.0.0.1 master

更改后的文件内容如下所示:

hbase 需要什么配置服务器_hbase_08

编辑完成后保存文件并退出vi编辑器。

3.   通过下列命令检测主机名与IP映射是否配置成功:

ping master -c 4

如果配置成功,则会显示如下结果:

hbase 需要什么配置服务器_linux_09

SElinux安全配置

步骤1.  关闭SElinux

1.   通过下列命令使用vi编辑器打开SElinux配置文件:

vi /etc/selinux/config

打开后的文件内容如下所示:

hbase 需要什么配置服务器_hbase_10

 2.   在文件中进行内容更改,将SELINUX=permissive改写成SELINUX=disabled:

更改后的文件内容如下所示:

hbase 需要什么配置服务器_hadoop_11

编辑完成后保存文件并退出vi编辑器。

步骤4.  SElinux配置强制生效

更改后的内容会在下次系统重启的时候生效,为了操作便捷性,使用下列命令使更改即时生效,而不需要重新启动系统:

setenforce 0

配置SSH免密码登录

步骤1.  生成秘钥

1.   输入下面的命令,生成本机密钥文件:

ssh-keygen -t dsa

按下四次回车,默认会将秘钥文件生成到~/.ssh/目录下:

hbase 需要什么配置服务器_数据库_12

 通过下列命令查看~/.ssh目录下的文件:

ls ~/.ssh

可以看到在~/.ssh目录下已经生成了id_dsa.pub(本机的公钥)和id_dsa(本机的私钥)文件:

hbase 需要什么配置服务器_hbase 需要什么配置服务器_13

步骤2.  秘钥分发

输入命令如下:

cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys

上述命令运行完成后再次查看~/.ssh目录下的文件,可以看到已经创建了authorized_keys文件:

hbase 需要什么配置服务器_hbase 需要什么配置服务器_14

步骤3.  验证免密码登录是否配置成功

使用下列命令通过设置的主机名进行连接,可以验证免密码登录是否配置成功:

ssh master

第一次登录的时候,会询问是否继续连接,输入yes即可进入

hbase 需要什么配置服务器_linux_15

连接成功后,我们需要通过下列命令退出连接:

exit

命令运行后显示的内容如下所示:

hbase 需要什么配置服务器_数据库_16

安装配置Hadoop

步骤1.  解压安装文件

通过下列命令解压Hadoop安装文件,将文件解压到/usr/cx目录下:

tar -zxvf /usr/software/hadoop-2.7.1.tar.gz -C /usr/cx

命令执行后的输出内容如下所示:

hbase 需要什么配置服务器_hadoop_17

步骤2.  配置Hadoop环境变量

1.   通过下列命令使用vi编辑器编辑~/.bashrc文件:

vi  ~/.bashrc

打开后的文件内容如下所示:

hbase 需要什么配置服务器_hbase 需要什么配置服务器_18

2.   在~/.bashrc文件中增加以下内容:

export HADOOP_HOME=/usr/cx/hadoop-2.7.1

export PATH=$PATH:$HADOOP_HOME/bin:$PATH

export PATH=$PATH:$HADOOP_HOME/sbin:$PATH

编辑完成后保存文件并退出vi编辑器。

3.   执行如下命令,更新环境变量:

source  ~/.bashrc

4.   通过下列命令验证Hadoop环境变量是否配置成功:

hadoop

如果出现如下提示信息,则说明Hadoop安装配置成功:

hbase 需要什么配置服务器_hadoop_19

步骤3.  编辑Hadoop配置文件

1.   使用vi命令打开hadoop-env.sh配置文件进行编辑:

vi /usr/cx/hadoop-2.7.1/etc/hadoop/hadoop-env.sh

打开后的文件内容如下所示:

hbase 需要什么配置服务器_linux_20

在文件中进行下列内容更改,将JAVA_HOME对应的值改成实际的JDK安装目录:

export  JAVA_HOME=/usr/cx/jdk1.8.0_60

编辑完成后保存文件并退出vi编辑器。

2.   使用vi命令打开core-site.xml配置文件进行编辑:

vi /usr/cx/hadoop-2.7.1/etc/hadoop/core-site.xml

打开后的文件内容如下所示:

hbase 需要什么配置服务器_hadoop_21

在文件中<configuration>和</configuration>之间增加下列内容:

/*设置默认的HDFS访问路径*/

<property>

<name>fs.defaultFS</name>

<value>hdfs://master:9000</value>

</property>

/*缓冲区大小:io.file.buffer.size默认是4KB*/

<property>

<name>io.file.buffer.size</name>

<value>131072</value>

</property>

/*临时文件夹路径设置*/

<property>

<name>hadoop.tmp.dir</name>

<value>file:/usr/tmp</value>

</property>

/*设置使用hduser用户可以代理所有主机用户进行任务提交*/

<property>

<name>hadoop.proxyuser.hduser.hosts</name>

<value>*</value>

</property>

/*设置使用hduser用户可以代理所有组用户进行任务提交*/

<property>

<name>hadoop.proxyuser.hduser.groups</name>

<value>*</value>

</property>

编辑完成后保存文件并退出vi编辑器。

3.   使用vi命令打开yarn-site.xml文件进行配置:

vi /usr/cx/hadoop-2.7.1/etc/hadoop/yarn-site.xml

打开后的文件内容如下所示:

hbase 需要什么配置服务器_数据库_22

在文件中<configuration>和</configuration>之间增加下列内容:

/*设置NodeManager上运行的附属服务,需配置成mapreduce_shuffle才可运行MapReduce程序*/

<property>

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

<property>

<name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>

<value>org.apache.hadoop.mapred.ShuffleHandler</value>

</property>

/*设置客户端与ResourceManager的通信地址*/

<property>

<name>yarn.resourcemanager.address</name>

<value>master:8032</value>

</property>

/*设置ApplicationMaster调度器与ResourceManager的通信地址*/

<property>

<name>yarn.resourcemanager.scheduler.address</name>

<value>master:8030</value>

</property>

/*设置NodeManager与ResourceManager的通信地址*/

<property>

<name>yarn.resourcemanager.resource-tracker.address</name>

<value>master:8031</value>

</property>

/*设置管理员与ResourceManager的通信地址*/

<property>

<name>yarn.resourcemanager.admin.address</name>

<value>master:8033</value>

</property>

/* ResourceManager的Web地址,监控资源调度*/

<property>

<name>yarn.resourcemanager.webapp.address</name>

<value>master:8088</value>

</property>

编辑完成后保存文件并退出vi编辑器。

4.   使用下列命令复制mapred-site.xml.template文件并重命名为mapred-site.xml:

cp /usr/cx/hadoop-2.7.1/etc/hadoop/mapred-site.xml.template /usr/cx/hadoop-2.7.1/etc/hadoop/mapred-site.xml

5.   使用vi命令打开mapred-site.xml文件进行配置:

vi /usr/cx/hadoop-2.7.1/etc/hadoop/mapred-site.xml

打开后的文件内容如下所示:

hbase 需要什么配置服务器_hbase 需要什么配置服务器_23

在文件中<configuration>和</configuration>之间增加下列内容:

/*Hadoop对MapReduce运行框架一共提供了3种实现,在mapred-site.xml中通过"mapreduce.framework.name"这个属性来设置为"classic"、"yarn"或者"local"*/

<property>

<name>mapreduce.framework.name</name>

<value>yarn</value>

</property>

/*MapReduce JobHistory Server地址*/

<property>

<name>mapreduce.jobhistory.address</name>

<value>master:10020</value>

</property>

/*MapReduce JobHistory Server Web UI访问地址*/

<property>

<name>mapreduce.jobhistory.webapp.address</name>

<value>master:19888</value>

</property>

编辑完成后保存文件并退出vi编辑器。

6.   执行以下命令创建Hadoop的数据存储目录namenode和datanode:

mkdir -p /hdfs/namenode
mkdir -p /hdfs/datanode

7.   使用vi命令打开hdfs-site.xml文件进行配置:

vi /usr/cx/hadoop-2.7.1/etc/hadoop/hdfs-site.xml

打开后的文件内容如下所示:

hbase 需要什么配置服务器_hbase_24

在文件中<configuration>和</configuration>之间增加下列内容:

/*配置SecondaryNameNode地址*/

<property>

<name>dfs.namenode.secondary.http-address</name>

<value>master:9001</value>

</property>

/*配置NameNode的数据存储目录,需要与上文创建的目录相对应*/

<property>

<name>dfs.namenode.name.dir</name>

<value>file:/hdfs/namenode</value>

</property>

/*配置DataNode的数据存储目录,需要与上文创建的目录相对应*/

<property>

<name>dfs.datanode.data.dir</name>

<value>file:/hdfs/datanode</value>

</property>

/*配置数据块副本数*/

<property>

<name>dfs.replication</name>

<value>1</value>

</property>

/*将dfs.webhdfs.enabled属性设置为true,否则就不能使用webhdfs的LISTSTATUS、LIST FILESTATUS等需要列出文件、文件夹状态的命令,因为这些信息都是由namenode保存的*/

<property>

<name>dfs.webhdfs.enabled</name>

<value>true</value>

</property>

编辑完成后保存文件并退出vi编辑器。

8.   使用vi命令打开slaves文件进行配置:

vi /usr/cx/hadoop-2.7.1/etc/hadoop/slaves

打开后的文件内容如下所示:

hbase 需要什么配置服务器_hbase 需要什么配置服务器_25

将文件中的内容更改为下列内容:

hbase 需要什么配置服务器_hbase 需要什么配置服务器_26

编辑完成后保存文件并退出vi编辑器。

步骤4.  格式化HDFS

通过下列命令格式化HDFS文件系统:

hadoop namenode -format

命令运行后的部分显示内容如下所示:

hbase 需要什么配置服务器_linux_27

Hadoop运行及测试

步骤1.  启动Hadoop

1.   通过下列命令启动Hadoop:

start-all.sh

命令运行后的输出内容如下所示:

hbase 需要什么配置服务器_linux_28

2.   通过下列命令,查看相应的JVM进程确定Hadoop是否配置及启动成功:

jps

当有以下进程启动时,则说明Hadoop已经成功启动,如果某个进程没有启动,则需要查看日志文件确定错误发生的原因:

hbase 需要什么配置服务器_hadoop_29

步骤2.  Web页面测试

1.   当Hadoop成功启动后,我们打开浏览器,输入网址http://master:8088便可以访问任务调度的Web管理页面:

hbase 需要什么配置服务器_hadoop_30

2.   当Hadoop成功启动后,我们打开浏览器,输入网址http://master:50070便可以访问HDFS的Web管理页面:

hbase 需要什么配置服务器_hadoop_31

安装配置HBase

可以在Apache镜像网站上下载稳定版本的HBase安装包,下载地址为http://mirror.bit.edu.cn/apache/

步骤1.  HBase环境配置

1.   通过下面的命令解压缩HBase安装包:

tar -zxvf /usr/software/hbase-1.0.1.1-bin.tar.gz -C /usr/cx/

命令运行后的返回结果如下所示:

hbase 需要什么配置服务器_数据库_32

2.   通过下列命令使用vi编辑器编辑~/.bashrc文件:

vi  ~/.bashrc

打开后的文件内容如下所示:

hbase 需要什么配置服务器_数据库_33

3.   在~/.bashrc文件中增加HBase配置路径信息:

export HBASE_HOME=/usr/cx/hbase-1.0.1.1

export PATH=$HBASE_HOME/bin:$PATH

编辑完成后保存文件并退出vi编辑器。

4.   执行如下命令,更新环境变量:

source  ~/.bashrc

5.   通过下列命令验证HBase环境变量是否配置成功:

hbase

如果出现如下提示信息,则说明HBase环境配置成功:

hbase 需要什么配置服务器_数据库_34

步骤2.  HBase配置及启动

1.   通过下列命令使用vi编辑器编辑HBase配置文件hbase-env.sh:

vi /usr/cx/hbase-1.0.1.1/conf/hbase-env.sh

打开后的文件内容如下所示:

hbase 需要什么配置服务器_hadoop_35

修改配置文件hbase-env.sh,在文件中增加下列内容:

export JAVA_HOME=/usr/cx/jdk1.8.0_60

export HBASE_MANAGES_ZK=true

注:设置HBASE_MANAGES_ZK=true表示ZooKeeper交给HBase管理,使用HBase自带的ZooKeeper,启动HBase时会自动启动hbase-site.xml里的hbase.zookeeper.quorum属性中的所有zookeeper实例。

2.   通过下列命令使用vi编辑器编辑HBase配置文件hbase-site.xml:

vi /usr/cx/hbase-1.0.1.1/conf/hbase-site.xml

打开后的文件内容如下所示:

hbase 需要什么配置服务器_linux_36

在配置文件hbase-site.xml的<configuration></configution>之间添加如下所示的配置信息:

<property>

     <name>hbase.rootdir</name>

     <value>hdfs://master:9000/hbase</value>

</property>

<property>

     <name>dfs.replication</name>

     <value>1</value>

</property>

<property>

     <name>hbase.cluster.distributed</name>

     <value>true</value>

</property>

<property>

     <name>hbase.zookeeper.property.dataDir</name>

     <value>/usr/cx/hbase-1.0.1.1/zookeeper</value>

</property>

通过hbase.rootdir配置RegionServer的共享目录,用来持久化HBase。/hbase表示HBase在HDFS中占用的实际存储目录,HDFS的NameNode运行在主机名为master的9000端口,因此需要设置为hdfs://master:9000/

通过hbase.cluster.distributed指定HBase的运行模式。为false表示单机模式运行(此时HBase和ZooKeeper会运行在同一个JVM中),为true表示以分布式模式运行,默认值是false。

通过hbase.zookeeper.property.dataDir这个参数可以设置ZooKeeper快照的存储位置。默认值是/tmp,在操作重启的时候该目录会被清空,应该设置默认值到其它目录,我们这里设置值为/usr/cx/hbase-1.0.1.1/zookeeper (这个路径需要运行HBase的用户拥有读写操作权限)。

3.   配置文件修改完毕后,我们便可以运行如下脚本启动HBase:

start-hbase.sh

命令运行后的返回结果如下所示:

hbase 需要什么配置服务器_hbase_37

4.   通过下面的命令查看HBase是否配置以及启动成功:

jps

如果HBase配置以及启动成功,则会出现下面3个与HBase相关的进程:

hbase 需要什么配置服务器_数据库_38

5.   HBase启动成功后,通过在浏览器中访问HMater的16010端口便可以查看HBase的Web UI界面,访问网址为http://master:16010,图 6.7 HBase Web UI中的属性部分列出了集群的一些关键信息,这些信息包括HBase的版本、ZooKeeper集群的主机列表、HBase根目录等。

hbase 需要什么配置服务器_linux_39

在Tables标签下列举出了目前HBase上有哪些表及表的一些基本信息,其中hbase:meta和hbase:namespace表是永远存在且成功加载的,如果这两张表加载不成功,那么集群虽然已经启动,但是却无法正常读写数据。

hbase 需要什么配置服务器_linux_40

 Hbase基本操作

1.   HBase启动后,可以通过命令行工具连接HBase,从而对HBase中的表进行基本操作,在终端模拟器下通过下面的命令进入HBase命令行操作界面:

hbase shell

命令运行后的返回结果如下所示:

hbase 需要什么配置服务器_hbase_41

2.   通过下面的命令可以创建一个名称为test的数据表,其中数据表下有一个cf列族:

create 'test','cf'

命令运行后的返回结果如下所示:

hbase 需要什么配置服务器_hadoop_42

3.   通过下面的命令可以向test数据表中新增一个列字段a,并插入数据,其中插入的行号为row1,插入的数据值为value1:

put 'test', 'row1', 'cf:a', 'value1'

命令运行后的返回结果如下所示:

hbase 需要什么配置服务器_linux_43

4.   通过下面的命令可以查看表数据(HBase中的列是由列族前缀和列的名字组成的,以冒号分隔):

scan 'test'

命令运行后的返回结果如下所示:

hbase 需要什么配置服务器_hadoop_44

5.   通过下面的命令可以获取表中指定行的数据:

get 'test','row1'

命令运行后的返回结果如下所示:

hbase 需要什么配置服务器_hadoop_45

6.   通过下面的命令可以下线表(此时表将无法被使用):

disable 'test'

命令运行后的返回结果如下所示:

hbase 需要什么配置服务器_hbase 需要什么配置服务器_46

7.   通过下面的命令可以删除表(如果希望删除表,必须先将表下线):

drop 'test'

命令运行后的返回结果如下所示:

hbase 需要什么配置服务器_hbase_47

8.   通过下面的命令可以退出HBase Shell命令行界面:

exit

命令运行后的返回结果如下所示:

hbase 需要什么配置服务器_数据库_48

9.   通过下面的命令可以停止HBase集群:

stop-hbase.sh

命令运行后的返回结果如下所示:

hbase 需要什么配置服务器_hbase 需要什么配置服务器_49

至此,hbase安装成功!!