搭建spark on yarn 集群 spark分布式集群搭建步骤

转载

我是数据分析师 2024-03-08 19:58:18

文章标签 搭建spark on yarn 集群 hadoop vim xml 文章分类 Spark 大数据

主要过程有：

一、安装前的准备：

先将26作为主节点搭建环境。以下目录都基于/home/hml/xtu1/。

192.168.1.126 master

192.168.1.123 slave1

1. 环境：

Ubuntu 17.0

JDK1.8.0_161

Scala-2.11.8

Hadoop-2.7.4

Spark-2.2.1-bin-hadoop2.7

2. 安装vim编辑器（dmdb-26）

3. 安装SSH，配置SSH免密码登录

4. Ubuntu下设置静态IP

5. 本机电脑安装好xshell和xftp

二、安装过程：

1. JDK的安装与配置

2. Scale的安装与配置

3. Hadoop的安装与配置

4. Spark的安装与配置

实验步骤记录：

0. 修改主机名和添加主机IP与主机名映射

1）将之前的修改为dmdb-26:

$sudo vim /etc/hostname

2）修改127.0.0.1后面的主机名：

$sudo vim /etc/hosts

3）添加映射，在后面添加： $sudo vim /etc/hosts

192.168.1.126 dmdb-26

192.168.1.123 dmdb-23 （slave1）

1. 安装SSH，配置SSH免密码登录

进入主目录/home/hml

1）查看是否安装了SSH:

$sudo ps -e |grep ssh

2）进入root目录：

$cd /home/hml

3） $sudo apt-get update

4）客户端和服务端都安装：

$sudo apt-get install openssh-server

5）测试是否可以登录：

$ssh –l dmdb 192.168.1.126

6）开始配置免密码登录：

$cd /home/hml/

$ssh-keygen -t rsa -P ""

7）将公钥追加到authorized_keys 文件中:

$ cat .ssh/id_rsa.pub >> .ssh/authorized_keys

8）赋予authorized_keys 文件权限:

$chmod600 .ssh/authorized_keys

9）验证免密码登录：

$ssh localhost

2. Ubuntu下设置静态IP

1）查看网卡名称，知道dmdb-26网卡为enp9s0f0

$ifconfig

2）查看默认网关地址，192.168.1.1

$route

3）在下面文件中注释掉之前的配置，并添加以下内容：

$vim /etc/network/interfaces

4）重启使静态IP设置生效。

3. JDK的安装与配置

1）卸载jdk：$rpm -e jdk （强制卸载：rpm -e –nodepsjdk）

sudo apt-get remove openjdk

2）进入路径：$cd /home/hml/xtu1（创建目录：$sudo mkdir /usr/lib/jvm）

3）解压：$sudo tar -xzf jdk-8u161-linux-x64.tar.gz

其他格式的解压命令：

tar:tar –xvf

gz:gzip -d /gunzip

tar.gz和tgz: tar -xzf

4）修改配置文件：$sudo vim /etc/profile

添加：

exportJAVA_HOME=/home/hml//xtu1/jdk1.8.0_161
exportJRE_HOME=/home/hml/xtu1/jdk1.8.0_161/jre
exportPATH=$JAVA_HOME/bin:$JAVA_HOME/jre/bin:$PATH
export CLASSPATH=$CLASSPATH:.:$JAVA_HOME/lib:$JAVA_HOME/jre/lib

5）使配置文件生效：$source /etc/profile

6）验证：$java -version

4.Scala的安装与配置

Scala安装过程与JDK类似。

1）创建目录：sudo mkdir /home/hml/xtu1/scala

2）解压到目录/home/hml/xtu1/scala ：

$sudo tar -xzf scala-2.11.8.tgz -C/home/hml/xtu1/scala

3）环境变量的配置如下：

$sudo vim /etc/profile

添加：

exportSCALA_HOME=/home/hml/xtu1/scala-2.11.8
export PATH=$PATH:$SCALA_HOME/bin

4）最后使环境变量生效:

$source/etc/profile

5.hadoop的安装与配置

1.解压到/home/hml/xtu1/:

$sudo tar -xzf hadoop-2.7.4.tar.gz-C /home/hml/xtu1

2.配置环境变量

$ sudo vim /etc/profile

添加：

exportHADOOP_HOME=/home/hml/xtu1/hadoop-2.7.4
exportPATH=$PATH:$HADOOP_HOME/bin
exportPATH=$PATH:$HADOOP_HOME/sbin
exportHADOOP_MAPRED_HOME=${HADOOP_HOME}
exportHADOOP_COMMON_HOME=${HADOOP_HOME}
exportHADOOP_HDFS_HOME=${HADOOP_HOME}
exportHADOOP_YARN_HOME=${HADOOP_HOME}

3.使环境变量生效：$ source /etc/profile

4. 在/home/hml/xtu1/hadoop目录中创建几个文件夹：

$cd /usr/local/hadoop
/usr/local/hadoop$mkdir tmp
/usr/local/hadoop$mkdir tmp/dfs
/usr/local/hadoop$mkdir tmp/dfs/data
/usr/local/hadoop$mkdir tmp/dfs/name
/usr/local/hadoop$sudo chown hadoop:hadoop tmp

5.进入目录/home/hml/xtu1/hadoop-2.7.4/etc/hadoop/，在该目录下配置7个文件：hadoop-env.sh，core-site.xml，hdfs-site.xml，mapred-site.xml，yarn-site.xml，yarn-env.sh，slaves，masters。参照各文件的xxx.xml.template(对应的模板）修改。

（1）hadoop-env.sh

exportJAVA_HOME=/home/hml/xtu1/jdk1.8.0_161

（2）core-site.xml

（3）hdfs-site.xml

（4）mapred-site.xml

（5）yarn-site.xml

（6）slaves：$sudo vim slaves

将localhost去掉，加上dmdb-23等子节点，一行一个。

（7）masters：sudo vim masters

写上主节点dmdb-26。

（8）验证hadoop安装好：

1）第一次启动Hadoop需要初始化，切换到/home/hml/xtu1/hadoop-2.7.4/bin目录下输入：$hadoop namenode -format

2）切换到/home/hml//xtu1/hadoop-2.7.4/sbin目录，启动HDFS输入:

$start-dfs.sh

(这里还没有配置dmdb-23,所以这里显示找不到)

3）启动YARN,输入:$start-yarn.sh

6.spark的安装与配置

1. 进入目录：$cd /home/hml/xtu1

2. 解压到目录/home/hml/xtu1/spark-2.2.1-bin-hadoop2.7

$sudo tar -xzf spark-2.2.1-bin-hadoop2.7.tgz -C/home/hml/xtu1

3. 配置环境变量

$ sudo vi /etc/profile

配置如下：

export SPARK_HOME=/home/hml//xtu1/spark-2.2.1-bin-hadoop2.7
export PATH=$PATH:$SPARK_HOME/bin

4. 使变量生效：$ source /etc/profile

5. 进入spark-2.2.1-bin-hadoop2.7/conf/目录，编辑两个文件：spark-env.sh，slaves

1）$ sudo vim /conf/spark-env.sh

2）$ vim slaves

增加所有的子节点主机名，dmdb-23，一行一个

6. 在spark-1.1.0/sbin/目录下启动spark集群（仅在master结点）

$ start-all.sh

7.将spark master节点环境复制到其他slave节点

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

上一篇：android返回界面闪一下安卓手机显示返回键

下一篇：docker fc docker fc游戏项目

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

搭建spark on yarn 集群 spark分布式集群搭建步骤

搭建spark on yarn 集群 spark分布式集群搭建步骤

51CTO博客