hadoop 指定队列

原创

mob64ca12d61d6b 2023-08-16 04:11:35 ©著作权

文章标签 Text Hadoop apache 文章分类 Hadoop 大数据

©著作权归作者所有：来自51CTO博客作者mob64ca12d61d6b的原创作品，请联系作者获取转载授权，否则将追究法律责任

Hadoop指定队列的实现步骤

概述

Hadoop是一个开源的分布式计算框架，用于处理大规模数据集的计算。在Hadoop集群中，一个队列用于管理提交的作业，将其分配给可用的资源进行执行。本文将介绍如何实现Hadoop指定队列的功能。

整体流程

下表展示了实现Hadoop指定队列的整体流程：

步骤	描述
步骤1	修改yarn-site.xml配置文件
步骤2	重启YARN服务
步骤3	创建队列
步骤4	提交作业到指定队列

接下来，我们将逐步介绍每个步骤需要做什么，以及相应的代码。

步骤1：修改yarn-site.xml配置文件

首先，我们需要修改Hadoop的yarn-site.xml配置文件。该文件包含了YARN（Hadoop的资源管理器）的配置信息。我们需要找到以下配置项：

<property>
  <name>yarn.scheduler.capacity.root.queues</name>
  <value>default</value>
</property>

将其中的default修改为我们想要创建的队列名称。例如，如果我们想要创建一个名为myqueue的队列，修改后的配置项如下：

<property>
  <name>yarn.scheduler.capacity.root.queues</name>
  <value>myqueue</value>
</property>

步骤2：重启YARN服务

完成配置文件的修改后，我们需要重启YARN服务使其加载新的配置。可以使用以下命令重启YARN服务：

yarn resourcemanager -format
start-yarn.sh

步骤3：创建队列

现在我们已经配置好了队列名称，接下来需要在YARN中创建该队列。可以使用以下命令来创建队列：

yarn queue -create myqueue

这将在YARN中创建一个名为myqueue的队列。

步骤4：提交作业到指定队列

在队列创建完成后，我们可以将作业提交到指定队列中。在提交作业时，可以使用以下参数指定作业所属的队列：

-Dmapreduce.job.queuename=myqueue

其中，myqueue为我们创建的队列名称。

完整示例

下面是一个完整的示例，展示了如何实现Hadoop指定队列的功能：

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.hadoop.mapreduce.Reducer;

public class WordCount {
  
  public static class WordCountMapper extends Mapper<Object, Text, Text, Text> {
    
    private final static Text word = new Text();
    
    protected void map(Object key, Text value, Context context) throws IOException, InterruptedException {
      String line = value.toString();
      String[] words = line.split(" ");
      
      for (String w : words) {
        word.set(w);
        context.write(word, new Text("1"));
      }
    }
  }
  
  public static class WordCountReducer extends Reducer<Text, Text, Text, Text> {
    
    private Text result = new Text();
    
    protected void reduce(Text key, Iterable<Text> values, Context context) throws IOException, InterruptedException {
      int sum = 0;
      
      for (Text val : values) {
        sum += Integer.parseInt(val.toString());
      }
      
      result.set(Integer.toString(sum));
      context.write(key, result);
    }
  }
  
  public static void main(String[] args) throws Exception {
    Configuration conf = new Configuration();
    Job job = Job.getInstance(conf, "word count");
    job.setJarByClass(WordCount.class);
    job.setMapperClass(WordCountMapper.class);
    job.setCombinerClass(WordCountReducer.class);
    job.setReducerClass(WordCountReducer.class);
    job.setOutputKeyClass(Text.class);
    job.setOutputValueClass(Text.class);
    job.setInputFormatClass(TextInputFormat.class);
    job.setOutputFormatClass(TextOutputFormat.class);
    job.getConfiguration().set("mapreduce.job.queuename", "myqueue"); // 指定队列名称
    FileInputFormat.addInputPath(job, new Path(args[0]));
    FileOutputFormat.setOutputPath(job, new Path(args[1]));
    System.exit(job.waitForCompletion(true) ? 0 : 1);