这里写自定义目录标题

  • 一. 原理分析
  • 二. 搭建HDFS高可用集群
  • 1. 环境准备
  • 2. 安装zookeeper
  • 3. zookeeper 安装包下载
  • 4.准备3个zk下创建数据存放目录
  • 5.在每个数据文件夹中准备一个myid文件
  • 6. 编辑每个data目录中myid
  • 7. 将zk配置文件zoo.cfg创建在zkdata目录中
  • 8.启动zk节点
  • 8. 查看zk角色信息
  • 9. 其他三台Hadoop机器
  • 10.配置hadoop的core-site.xml 三个机器一致
  • 11.配置hdfs-site.xml
  • 12. 修改slaves文件指定哪些机器为DataNode
  • 13.在任意一个namenode上执行如下命令
  • 14.启动journalnode(分别在在hadoop12、hadoop13、hadoop14上执行)
  • 15.在hadoop13上执行(NameNode active)节点执行
  • 16.启动hdfs集群
  • 17.在standby 的 NameNode节点上执行如下命令
  • 18.停止Hadoop12正常NameNode进行测试


一. 原理分析

在故障自动转移的处理上,引入了监控Namenode状态的ZookeeperFailController(ZKFC)。ZKFC一般运行在Namenode的宿主机器上,与Zookeeper集群协作完成故障的自动转移。

hadoop 需要zookeeper吗 hdfs需要zookeeper吗_xml

二. 搭建HDFS高可用集群

1. 环境准备

搭建HDFS环境前面有

zk1 192.168.153.9
zk2 192.168.153.10
zk3 192.168.153.11
hadoop12 192.168.153.12
hadoop13 192.168.153.13
hadoop14 192.168.153.14

hadoop 需要zookeeper吗 hdfs需要zookeeper吗_hadoop 需要zookeeper吗_02

2. 安装zookeeper

hadoop 需要zookeeper吗 hdfs需要zookeeper吗_hadoop_03

3. zookeeper 安装包下载

zookeeper 安装包下载

链接:https://pan.baidu.com/s/1TzzEDBNlxQxOMeleE0YHxw
提取码:ngkp
复制这段内容后打开百度网盘手机App,操作更方便哦

4.准备3个zk下创建数据存放目录

mkdir -p /root/zkdata

hadoop 需要zookeeper吗 hdfs需要zookeeper吗_hadoop_04

5.在每个数据文件夹中准备一个myid文件

touch /root/zkdata/myid

hadoop 需要zookeeper吗 hdfs需要zookeeper吗_hadoop 需要zookeeper吗_05

6. 编辑每个data目录中myid

vim /root/zkdata/myid 分别在zk的myid输入 1 2 3

hadoop 需要zookeeper吗 hdfs需要zookeeper吗_hdfs_06

7. 将zk配置文件zoo.cfg创建在zkdata目录中

添加配置文件

tickTime=2000
initLimit=10
syncLimit=5
dataDir=/root/zkdata
clientPort=3001
server.1=zk1:3002:3003
server.2=zk2:4002:4003
server.3=zk3:5002:5003

三台zk的配置文件

vim /root/zkdata/zoo.cfg

hadoop 需要zookeeper吗 hdfs需要zookeeper吗_xml_07

8.启动zk节点

./zkServer.sh start /root/zkdata/zoo.cfg

启动三台zk机器的zk结点

hadoop 需要zookeeper吗 hdfs需要zookeeper吗_hadoop_08

8. 查看zk角色信息

[root@zk3 bin]# ./zkServer.sh status /root/zkdata/zoo.cfg

hadoop 需要zookeeper吗 hdfs需要zookeeper吗_hdfs_09

9. 其他三台Hadoop机器

hadoop12 192.168.153.12 --- namenode(active)  & datanode &  DFSZKFailoverController(zkfc)
hadoop13 192.168.153.13 --- datanode   & namenode(standby) & DFSZKFailoverController(zkfc)
hadoop14 192.168.153.14 --- datanode

10.配置hadoop的core-site.xml 三个机器一致

[root@hadoop13 ~]# vim hadoop-2.9.2/etc/hadoop/core-site.xml

<configuration>
<property>
  <name>fs.defaultFS</name>
  <value>hdfs://ns</value>
</property>

<property>
  <name>hadoop.tmp.dir</name>
  <value>/root/hadoop-2.9.2/data</value>
</property>

<property>
        <name>ha.zookeeper.quorum</name>
  <value>zk1:3001,zk2:4001,zk3:5001</value>
</property>
</configuration>

hadoop 需要zookeeper吗 hdfs需要zookeeper吗_hdfs_10

11.配置hdfs-site.xml

vim hadoop-2.9.2/etc/hadoop/hdfs-site.xml

<configuration>

                <!--指定hdfs的nameservice为ns,需要和core-site.xml中的保持一致 -->
          <property>
                  <name>dfs.nameservices</name>
                  <value>ns</value>
          </property>
          <!-- ns下面有两个NameNode,分别是nn1,nn2 -->
          <property>
                  <name>dfs.ha.namenodes.ns</name>
                  <value>nn1,nn2</value>
          </property>
                <!-- nn1的RPC通信地址 -->
          <property>
                  <name>dfs.namenode.rpc-address.ns.nn1</name>
                  <value>hadoop12:9000</value>
          </property>
          <!-- nn1的http通信地址 -->
          <property>
                  <name>dfs.namenode.http-address.ns.nn1</name>
                  <value>hadoop12:50070</value>
          </property>
        <!-- nn2的RPC通信地址 -->
          <property>
                  <name>dfs.namenode.rpc-address.ns.nn2</name>
                  <value>hadoop13:9000</value>
          </property>
          <!-- nn2的http通信地址 -->
          <property>
                  <name>dfs.namenode.http-address.ns.nn2</name>
                  <value>hadoop13:50070</value>
          </property>

        <!-- 指定NameNode的元数据在JournalNode上的存放位置 -->
        <property>
                <name>dfs.namenode.shared.edits.dir</name>
                <value>qjournal://hadoop12:8485;hadoop13:8485;hadoop14:8485/ns</value>
        </property>
<!-- 指定JournalNode在本地磁盘存放数据的位置 -->
        <property>
                <name>dfs.journalnode.edits.dir</name>
                <value>/root/journal</value>
        </property>
        <!-- 开启NameNode故障时自动切换 -->
        <property>
                <name>dfs.ha.automatic-failover.enabled</name>
                <value>true</value>
        </property>
    <!-- 配置失败自动切换实现方式 -->
        <property>
                <name>dfs.client.failover.proxy.provider.ns</name>
                <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
        </property>
        <!-- 配置隔离机制,如果ssh是默认22端口,value直接写sshfence即可 -->
        <property>
                <name>dfs.ha.fencing.methods</name>
                <value>sshfence</value>
        </property>
        <!-- 使用隔离机制时需要ssh免登陆 -->
        <property>
                <name>dfs.ha.fencing.ssh.private-key-files</name>
                <value>/root/.ssh/id_rsa</value>
        </property>
</configuration>

hadoop 需要zookeeper吗 hdfs需要zookeeper吗_hadoop 需要zookeeper吗_11


hadoop 需要zookeeper吗 hdfs需要zookeeper吗_hadoop 需要zookeeper吗_12

12. 修改slaves文件指定哪些机器为DataNode

vim hadoop-2.9.2/etc/hadoop/slaves三台hadoop都是一样的配置

hadoop 需要zookeeper吗 hdfs需要zookeeper吗_xml_13

13.在任意一个namenode上执行如下命令

[root@hadoop12 ~]# hdfs zkfc -formatZK

hadoop 需要zookeeper吗 hdfs需要zookeeper吗_xml_14

14.启动journalnode(分别在在hadoop12、hadoop13、hadoop14上执行)

[root@hadoop12 ~]# hadoop-daemon.sh start journalnode
[root@hadoop13 ~]# hadoop-daemon.sh start journalnode
[root@hadoop14 ~]# hadoop-daemon.sh start journalnode

三台机器jps都是这个

hadoop 需要zookeeper吗 hdfs需要zookeeper吗_hadoop_15

15.在hadoop13上执行(NameNode active)节点执行

[root@hadoop13 ~]# hdfs namenode -format ns

hadoop 需要zookeeper吗 hdfs需要zookeeper吗_hdfs_16

16.启动hdfs集群

[root@hadoop13 ~]# start-dfs.sh

hadoop 需要zookeeper吗 hdfs需要zookeeper吗_xml_17

hadoop 需要zookeeper吗 hdfs需要zookeeper吗_hdfs_18

17.在standby 的 NameNode节点上执行如下命令

[root@hadoop12 ~]# hdfs namenode -bootstrapStandby[root@hadoop12 ~]# hadoop-daemon.sh start namenode

hadoop 需要zookeeper吗 hdfs需要zookeeper吗_hadoop 需要zookeeper吗_19


三台机器的jps

hadoop 需要zookeeper吗 hdfs需要zookeeper吗_xml_20

18.停止Hadoop12正常NameNode进行测试

hadoop 需要zookeeper吗 hdfs需要zookeeper吗_hdfs_21


Hadoop12由standby变成active

hadoop 需要zookeeper吗 hdfs需要zookeeper吗_hdfs_22