为什么需要“池”呢?程 序运行的本质,就是通过使用系统资源(CPU、内存、网 络、磁盘等)来完成信息的处理,比如在 JVM 中创建一个对象实例需要消耗 CPU 和内存资源,如果你的程序需要频 繁创建大量的对象,并且这些对象的存活时间短,就意味着 需要进行频繁销毁,那么很有可能这部分代码会成为性能的 瓶颈。 而“池”就是用来解决这个问题的,简单来说,对象池就是 把用过的对象保存起来,等下一次需要这种对象的时候,直 接从对象池中拿出来重复使用,避免频繁地创建和销毁。在 Java 中万物皆对象,线程也是一个对象,Java 线程是对操 作系统线程的封装,创建 Java 线程也需要消耗系统资源, 因此就有了线程池。JDK 中提供了线程池的默认实现,我们 也可以通过扩展 Java 原生线程池来实现自己的线程池。同样,为了提高处理能力和并发度,Web 容器一般会把处 理请求的工作放到线程池里来执行,Tomcat 扩展了原生的 Java 线程池,来满足 Web 容器高并发的需求.

Java 线程池里内部维护一个线程数组和一个任 务队列,当任务处理不过来的时,就把任务放到队列里慢慢 处理。

下面是Java 线程池核心类 ThreadPoolExecutor 的 构造函数

public ThreadPoolExecutor(int corePoolSize,
                          int maximumPoolSize,
                          long keepAliveTime,
                          TimeUnit unit,
                          BlockingQueue<Runnable> workQueue,
                          ThreadFactory threadFactory,
                          RejectedExecutionHandler handler)

  每次提交任务时,如果线程数还没达到核心线程数corePoolSize,线程池就创建新线程来执行。当线程数达到corePoolSize后,新增的任务就放到工作队列workQueue里,而线程池中的线程则努力地从workQueue里拉活来干,也就是调用 poll 方法来获取任务。

如果任务很多,并且workQueue是个有界队列,队列可能会满,此时线程池就会紧急创建新的临时线程来救场,如果总的线程数达到了最大线程数maximumPoolSize,则不能再创建新的临时线程了,转而执行拒绝策略handler,比如抛出异常或者由调用者线程来执行任务等。

 Java 提供了一些默认的线程池实现,比如 FixedThreadPool 和 CachedThreadPool,它们的本质就 是给 ThreadPoolExecutor 设置了不同的参数,是定制版的 ThreadPoolExecutor。

public static ExecutorService newFixedThreadPool(int nThreads) {
    return new ThreadPoolExecutor(nThreads, nThreads,
                                  0L, TimeUnit.MILLISECONDS,
                                 new LinkedBlockingQueue<Runnable>());
}
 
public static ExecutorService newCachedThreadPool() {
    return new ThreadPoolExecutor(0, Integer.MAX_VALUE,
                                  60L, TimeUnit.SECONDS,
                                  new SynchronousQueue<Runnable>());
}

  FixedThreadPool 有固定长度(nThreads)的线程数 组,忙不过来时会把任务放到无限长的队列里,这是因为 LinkedBlockingQueue 默认是一个无界队列。

CachedThreadPool 的 maximumPoolSize 参数值是 Integer.MAX_VALUE,因此它对线程个数不做限制,忙 不过来时无限创建临时线程,闲下来时再回收。它的任务 队列是SynchronousQueue,表明队列长度为 0。

跟 FixedThreadPool/CachedThreadPool 一样,Tomcat 的线程池也是一个定制版的 ThreadPoolExecutor。

通过比较 FixedThreadPool 和 CachedThreadPool,我们发现它们传给 ThreadPoolExecutor 的参数有两个关键点:

  • 是否限制线程个数。
  • 是否限制队列长度。

对于 Tomcat 来说,这两个资源都需要限制,也就是说要对 高并发进行控制,否则 CPU 和内存有资源耗尽的风险。因 此 Tomcat 传入的参数是这样的:

// 定制版的任务队列
taskqueue = new TaskQueue(maxQueueSize);
 
// 定制版的线程工厂
TaskThreadFactory tf = new TaskThreadFactory(namePrefix,daemon,getThreadPriority());
 
// 定制版的线程池
executor = new ThreadPoolExecutor(getMinSpareThreads(), getMaxThreads(), maxIdleTime, TimeUnit.MILLISECONDS,taskqueue, tf);

  Tomcat 有自己的定制版任务队列和线程工厂,并且可以 限制任务队列的长度,它的最大长度是maxQueueSize。 Tomcat 对线程数也有限制,设置了核心线程数 (minSpareThreads)和最大线程池数 (maxThreads)。

除了资源限制以外,Tomcat 线程池还定制自己的任务处理 流程。Java 原生线程池的任务处理逻辑比较简 单:

1. 前 corePoolSize 个任务时,来一个任务就创建一个新线 程。

2. 后面再来任务,就把任务添加到任务队列里让所有的线程 去抢,如果队列满了就创建临时线程。

3. 如果总线程数达到 maximumPoolSize,执行拒绝策略。

Tomcat 线程池扩展了原生的 ThreadPoolExecutor,通过重写 execute 方法实现了自己的任务处理逻辑:

1. 前 corePoolSize 个任务时,来一个任务就创建一个新线 程。

2. 再来任务的话,就把任务添加到任务队列里让所有的线程 去抢,如果队列满了就创建临时线程。

3. 如果总线程数达到 maximumPoolSize,则继续尝试把任 务添加到任务队列中去。

4. 如果缓冲队列也满了,插入失败,执行拒绝策略。

Tomcat 在线程总数达到最大数时,不是立即执 行拒绝策略,而是再尝试向任务队列添加任务,添加失败后 再执行拒绝策略。

public class ThreadPoolExecutor extends java.util.concurrent.ThreadPoolExecutor {
  
  ...
  
  public void execute(Runnable command, long timeout, TimeUnit unit) {
      submittedCount.incrementAndGet();
      try {
          // 调用 Java 原生线程池的 execute 去执行任务
          super.execute(command);
      } catch (RejectedExecutionException rx) {
         // 如果总线程数达到 maximumPoolSize,Java 原生线程池执行拒绝策略
          if (super.getQueue() instanceof TaskQueue) {
              final TaskQueue queue = (TaskQueue)super.getQueue();
              try {
                  // 继续尝试把任务放到任务队列中去
                  if (!queue.force(command, timeout, unit)) {
                      submittedCount.decrementAndGet();
                      // 如果缓冲队列也满了,插入失败,执行拒绝策略。
                      throw new RejectedExecutionException("...");
                  }
              } 
          }
      }
}

  Tomcat 线程池的 execute 方法会 调用 Java 原生线程池的 execute 去执行任务,如果总线程 数达到 maximumPoolSize,Java 原生线程池的 execute 方法会抛出 RejectedExecutionException 异常,但是这个 异常会被 Tomcat 线程池的 execute 方法捕获到,并继续 尝试把这个任务放到任务队列中去;如果任务队列也满了, 再执行拒绝策略。

submittedCount.incrementAndGet();这行代码的意思把 submittedCount 这个原子变量加一, 并且在任务执行失败,抛出拒绝异常时,将这个原子变量减 一:其实 Tomcat 线程池是用这个变量 submittedCount 来维 护已经提交到了线程池,但是还没有执行完的任务个数。Tomcat 的任务队列 TaskQueue 扩展了 Java 中的 LinkedBlockingQueue,我们知道 LinkedBlockingQueue 默认情况下长度是没有限制的,除 非给它一个 capacity。因此 Tomcat 给了它一个 capacity,TaskQueue 的构造函数中有个整型的参数 capacity,TaskQueue 将 capacity 传给父类 LinkedBlockingQueue 的构造函数。这个 capacity 参数是通过 Tomcat 的 maxQueueSize 参 数来设置的,但问题是默认情况下 maxQueueSize 的值是 Integer.MAX_VALUE,等于没有限制,这样就带来一个问 题:当前线程数达到核心线程数之后,再来任务的话线程池 会把任务添加到任务队列,并且总是会成功,这样永远不会 有机会创建新线程了。

为了解决这个问题,TaskQueue 重写了 LinkedBlockingQueue 的 offer 方法,在合适的时机返回 false,返回 false 表示任务添加失败,这时线程池会创建新 的线程。那什么是合适的时机呢?

public class TaskQueue extends LinkedBlockingQueue<Runnable> {
 
  ...
   @Override
  // 线程池调用任务队列的方法时,当前线程数肯定已经大于核心线程数了
  public boolean offer(Runnable o) {
 
      // 如果线程数已经到了最大值,不能创建新线程了,只能把任务添加到任务队列。
      if (parent.getPoolSize() == parent.getMaximumPoolSize()) 
          return super.offer(o);
          
      // 执行到这里,表明当前线程数大于核心线程数,并且小于最大线程数。
      // 表明是可以创建新线程的,那到底要不要创建呢?分两种情况:
      
      //1. 如果已提交的任务数小于当前线程数,表示还有空闲线程,无需创建新线程
      if (parent.getSubmittedCount()<=(parent.getPoolSize())) 
          return super.offer(o);
          
      //2. 如果已提交的任务数大于当前线程数,线程不够用了,返回 false 去创建新线程
      if (parent.getPoolSize()<parent.getMaximumPoolSize()) 
          return false;
          
      // 默认情况下总是把任务添加到任务队列
      return super.offer(o);
  }
  
}

  只有当前线程数大于核心线程数、 小于最大线程数,并且已提交的任务个数大于当前线程数 时,也就是说线程不够用了,但是线程数又没达到极限,才 会去创建新的线程。这就是为什么 Tomcat 需要维护已提交 任务数这个变量,它的目的就是在任务队列的长度无限制的 情况下,让线程池有机会创建新的线程。

默认情况下 Tomcat 的任务队列是没有限制的,你可以 通过设置 maxQueueSize 参数来限制任务队列的长度。