目录
- 什么是机架感知
- 如何感知机架
- Hadoop机架感知的作用
- 不开启机架感知的缺点
- 开启机架感知的优势
- 如何配置机架感知?
- 1.检查当前集群机架配置情况
- 2.自定义机器机架位置
- 3.自定义机架感知脚本
- 4.配置core-site.xml文件机架感知
- 5.验证机架感知配置
什么是机架感知
感知hadoop集群中每个机器节点所属的机架
如何感知机架
某台 slave 机器是属于哪个 rack 并非是智能感知的,而是需要 hadoop的管理者人为的告知 hadoop 哪台机器属于哪个 rack,这样在 hadoop的 namenode 启动初始化时,会将这些机器与 rack 的对应信息保存在内存中,用来作为对接下来所有的 HDFS 的写块操作分配 datanode列表时(比如 3 个 block 对应三台 datanode)的选择 datanode 策略,尽量将三个副本分布到不同的 rack。
Hadoop机架感知的作用
不开启机架感知的缺点
默认情况下,hadoop 的机架感知是没有被启用的。所以,在通常情况下,hadoop 集群的 HDFS 在选机器的时候,是随机选择的。
也就是说,如果实际节点不完全在相同的机架,但是又没有配置机架感知很有可能在写数据时:
hadoop 将第一块数据 block1 写到了rack1 上,然后随机的选择下将 block2 写入到了 rack2 下,此时两个rack 之间产生了数据传输的流量,再接下来,在随机的情况下,又将block3 重新又写回了 rack1,此时,两个 rack 之间又产生了一次数据流量。在 job 处理的数据量非常的大,或者往 hadoop 推送的数据量非常大的时候,这种情况会造成 rack 之间的网络流量成倍的上升,成为性能的瓶颈,进而影响作业的性能以至于整个集群的服务。
开启机架感知的优势
(1)不同节点之间的通信能够尽量发生在同一个机架之内,而不是跨机架;
(2)为了提高容错能力,名称节点会尽可能把数据块的副本放到多个机架上。
默认3副本情况下:
- client所在节点如果是DataNode节点,那么会在本节点存放一份副本;如果client在集群外,那么按照就近原则选一个节点存放副本;
- 第二个副本在另外一个机架的随机一个节点;
- 第三个副本在第二个副本所在机架的随机一个节点;
如何配置机架感知?
1.检查当前集群机架配置情况
- 执行hdfs dfsadmin -printTopology打印当前机架信息,可以看到默认所有节点都是一个机架 default-rack,此时没有配置机架感知。
Rack: /default-rack
172.16.91.102:9866 (hadoop102)
172.16.91.103:9866 (hadoop103)
172.16.91.104:9866 (hadoop104)
2.自定义机器机架位置
- 新建机架配置文件topology.data
vim $HADOOP_HOME/topology.data
由于由于官方配置文件没有确切的说明到底是主机名还是 ip 地址会被传入到脚本,所以在脚本中最好兼容主机名和 ip 地址。
172.16.91.102 hadoop102 /switch1/rack1
172.16.91.103 hadoop103 /switch1/rack1
172.16.91.104 hadoop104 /switch1/rack2
3.自定义机架感知脚本
- 在Hadoop的安装目录下新建脚本topology.sh
vim $HADOOP_HOME/topology.sh - 编写脚本内容
脚本参考的一位大佬的,上面的注释是我加上去的方便理解脚本作用,大家也可以自己写,只要符合入参、出参要求就可以。
#!/bin/bash
# 此处是你的机架配置文件topology.sh所在目录
HADOOP_CONF=/opt/module/hadoop-3.1.3
while [ $# -gt 0 ] ;
do
#脚本第一个参数节点ip或者主机名称赋值给nodeArg
nodeArg=$1
#以只读的方式打开机架配置文件
exec<${HADOOP_CONF}/topology.data
#声明返回值临时变量
result=""
#开始逐行读取
while read line
do
#赋值行内容给ar,通过这种 变量=( 值 )的方式赋值,下面可以通过数组的方式取出每个词
ar=( $line )
#判断输入的主机名或者ip是否和该行匹配
if [ "${ar[0]}" = "$nodeArg" ]||[ "${ar[1]}" = "$nodeArg" ]
then
#将机架信息赋值给result
result="${ar[2]}"
fi
done
shift
#-z判断字符串长度是否为0,不为0输出实际机架,为0返回默认机架信息
if [ -z "$result" ]
then
echo -n "/default-rack"
else
echo -n "$result"
fi
done
4.配置core-site.xml文件机架感知
实测脚本必须添加可执行权限,可以使用 [chmod 777 topology.sh]的方式添加权限
<!-- 配置机架感知配置脚本 -->
<property>
<name>net.topology.script.file.name</name>
<value>/opt/module/hadoop-3.1.3/topology.sh</value>
<!-- 注意这里是你脚本的实际位置 -->
</property>
5.验证机架感知配置
- 重启集群,执行hdfs dfsadmin -printTopology打印机架信息,可以看到集群已经按照配置感应到节点机架位置。
Rack: /switch1/rack1
172.16.91.102:9866 (hadoop102)
172.16.91.103:9866 (hadoop103)
Rack: /switch1/rack2
172.16.91.104:9866 (hadoop104) - 测试上传文件,因为只搭建了三个节点,因此设置副本数为2,查看两个副本是否存在不同的机架rack1和rack2上的节点。