怎么切换到hadoop的安装目录 hadoop三种安装模式

转载

代码探险家 2024-04-02 12:30:57

文章标签 怎么切换到hadoop的安装目录大数据操作系统 java hadoop 文章分类 Hadoop 大数据

Linux 环境安装

在VMware创建虚拟机,使用一主三从的架构,Linux版本为最新的7.6.1810,使用最小安装.

首先是下载镜像文件:下载链接

怎么切换到hadoop的安装目录 hadoop三种安装模式_hadoop

怎么切换到hadoop的安装目录 hadoop三种安装模式_大数据_02

怎么切换到hadoop的安装目录 hadoop三种安装模式_操作系统_03

修改主机名,需要重新登陆才能生效.

虚拟机挂在一边即可,可以使用xshell连接

怎么切换到hadoop的安装目录 hadoop三种安装模式_操作系统_04

准备好jdk: jdk-8u221-linux-x64.tar.gz 在Oracle官网上下载

怎么切换到hadoop的安装目录 hadoop三种安装模式_怎么切换到hadoop的安装目录_05

创建一个java目录,然后上传下载的jdk

怎么切换到hadoop的安装目录 hadoop三种安装模式_怎么切换到hadoop的安装目录_06

解压到/opt目录下

怎么切换到hadoop的安装目录 hadoop三种安装模式_怎么切换到hadoop的安装目录_07

然后添加环境变量

怎么切换到hadoop的安装目录 hadoop三种安装模式_怎么切换到hadoop的安装目录_08

怎么切换到hadoop的安装目录 hadoop三种安装模式_操作系统_09

更新一下环境变量,然后查看一下java版本

怎么切换到hadoop的安装目录 hadoop三种安装模式_java_10

到此一台具备java环境的Linux虚拟机搭建完成,拍摄一下快照.

Hadoop本地模式安装

Hadoop部署模式有：本地模式、伪分布模式、完全分布式模式、HA完全分布式模式.

区分的依据是NameNode、DataNode、ResourceManager、NodeManager等模块运行在几个JVM进程、几个机器。

怎么切换到hadoop的安装目录 hadoop三种安装模式_大数据_11

Hadoop 当前的版本:

怎么切换到hadoop的安装目录 hadoop三种安装模式_操作系统_12

这里下载3.2.0版本,下载链接

怎么切换到hadoop的安装目录 hadoop三种安装模式_怎么切换到hadoop的安装目录_13

在root目录下创建hadoop目录,然后把下载的压缩包上传

怎么切换到hadoop的安装目录 hadoop三种安装模式_hadoop_14

解压到/opt目录下

怎么切换到hadoop的安装目录 hadoop三种安装模式_操作系统_15

本地模式是最简单的模式，所有模块都运行与一个JVM进程中，使用的本地文件系统，而不是HDFS，本地模式主要是用于本地开发过程中的运行调试用。下载hadoop安装包后不用任何设置，默认的就是本地模式。

解压hadoop后就是直接可以使用

运行MapReduce程序，验证

我们这里用hadoop自带的wordcount例子来在本地模式下测试跑mapreduce。

前提保证:

怎么切换到hadoop的安装目录 hadoop三种安装模式_java_16

首先准备一个文本文件

怎么切换到hadoop的安装目录 hadoop三种安装模式_hadoop_17

然后调用mapreduce例子,使用的是wordcount功能

bash bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-3.2.0.jar wordcount ./test.txt ./output.txt

怎么切换到hadoop的安装目录 hadoop三种安装模式_java_18

怎么切换到hadoop的安装目录 hadoop三种安装模式_大数据_19

怎么切换到hadoop的安装目录 hadoop三种安装模式_大数据_20

傻了,后面指定的是输出的目录,该目录下面有两个文件,一个是成功的标志,一个是wordcount输出的结果

怎么切换到hadoop的安装目录 hadoop三种安装模式_hadoop_21

Hadoop伪分布式模式安装

伪分布式其实是一台机器上的模拟,所以还是先使用一台虚拟机做.

首先要拍下快照保存一下,

接下来要配置两个文件:core-site.xml ,hdfs-site.xml

先配置core-site.xml:

怎么切换到hadoop的安装目录 hadoop三种安装模式_大数据_22

输入以下配置

<configuration>
       <!--指定namenode的地址-->
   <property> <name>fs.defaultFS</name> <value>hdfs://namenode:8020</value> </property> <!--用来指定使用hadoop时产生文件的存放目录--> <property> <name>hadoop.tmp.dir</name> <value>/opt/data/tmp/</value> </property> <!--用来设置检查点备份日志的最长时间--> <name>fs.checkpoint.period</name> <value>3600</value> </configuration>

怎么切换到hadoop的安装目录 hadoop三种安装模式_hadoop_23

接着配置hdfs-site.xml

<configuration>
    <!--指定hdfs保存数据的副本数量-->
    <property> <name>dfs.replication</name> <value>1</value> </property> <!--指定hdfs中namenode的存储位置--> <property> <name>dfs.namenode.name.dir</name> <value>/opt/data/tmp/dfs/name</value> </property> <!--指定hdfs中datanode的存储位置--> <property> <name>dfs.datanode.data.dir</name> <value>file:/data/hadoop/hadoop-2.6.0/tmp/dfs/data</value> </property> </configuration>

怎么切换到hadoop的安装目录 hadoop三种安装模式_操作系统_24