并发通常需要线程池来支撑,否则直接频繁创建线程会迅速耗尽系统资源。
jdk预先自定义了几种线程池:比如缓存线程池、固定线程池、延迟线程池、单线程池,这些直接利用java
的 Executors的静态方法就可直接获取到。
虽然Executos创建线程池简单方便,但生产环境不管简单只管稳定,这些线程池其实都是直接调用ThreadPoolExecutor的构造函数返回了一个对象,只是提供的参数不同,最多延迟线程池与单线程池进行了简单的包装
我们先来研究ThreadPoolExecutor是怎么实现线程池的,分析源码:
线程池的主要结构:1、任务队列;2、工作线程;3、线程数目控制规则;4、任务拒绝策略
ThreadPoolExecutor对这些结构的支撑为:BlockingQueue充当任务队列,内部的Worker类作为工作线程,每个woker对象都含有一个线程,RejectedExecutionHandler接口属于拒绝策略接口,ThreadPoolExecutor已经提供了4个策略类,下面会介绍

类的成员变量

//记录线程池状态和线程数量(总共32位,前三位表示线程池状态,后29位表示线程数量),对象创建成功就是运行中状态
	private final AtomicInteger ctl = new AtomicInteger(ctlOf(RUNNING, 0));
    //线程数量统计位数29  Integer.SIZE=32 , 大约5亿,现在计算机好像还一次性开不了5亿个线程,足够用了
    private static final int COUNT_BITS = Integer.SIZE - 3;
    //容量 000 11111111111111111111111111111
    private static final int CAPACITY   = (1 << COUNT_BITS) - 1;

    //运行中 111 00000000000000000000000000000
    private static final int RUNNING    = -1 << COUNT_BITS;
    //关闭 000 00000000000000000000000000000
    private static final int SHUTDOWN   =  0 << COUNT_BITS;
    //停止 001 00000000000000000000000000000
    private static final int STOP       =  1 << COUNT_BITS;
    //整理 010 00000000000000000000000000000
    private static final int TIDYING    =  2 << COUNT_BITS;
    //终止 011 00000000000000000000000000000
    private static final int TERMINATED =  3 << COUNT_BITS;

状态

解释

RUNNING

运行态,可处理新任务并执行队列中的任务,是线程池创建好后的默认状态

SHUTDOW

关闭态,不接受新任务,但处理队列中的任务

STOP

停止态,不接受新任务,不处理队列中任务,且打断运行中任务

TIDYING

整理态,所有任务已经结束,workerCount = 0 ,将执行terminated()方法

TERMINATED

结束态,terminated() 方法已完成

构造方法

再看看构造方法,总共4个(这里只探究jdk7,8以上暂不介绍)

public ThreadPoolExecutor(int corePoolSize,
                              int maximumPoolSize,
                              long keepAliveTime,
                              TimeUnit unit,
                              BlockingQueue<Runnable> workQueue) {
        this(corePoolSize, maximumPoolSize, keepAliveTime, unit, workQueue,
             Executors.defaultThreadFactory(), defaultHandler);
    }
    public ThreadPoolExecutor(int corePoolSize,
                              int maximumPoolSize,
                              long keepAliveTime,
                              TimeUnit unit,
                              BlockingQueue<Runnable> workQueue,
                              ThreadFactory threadFactory) {
        this(corePoolSize, maximumPoolSize, keepAliveTime, unit, workQueue,
             threadFactory, defaultHandler);
    }

    public ThreadPoolExecutor(int corePoolSize,
                              int maximumPoolSize,
                              long keepAliveTime,
                              TimeUnit unit,
                              BlockingQueue<Runnable> workQueue,
                              RejectedExecutionHandler handler) {
        this(corePoolSize, maximumPoolSize, keepAliveTime, unit, workQueue,
             Executors.defaultThreadFactory(), handler);
    }
    
    public ThreadPoolExecutor(int corePoolSize,
                              int maximumPoolSize,
                              long keepAliveTime,
                              TimeUnit unit,
                              BlockingQueue<Runnable> workQueue,
                              ThreadFactory threadFactory,
                              RejectedExecutionHandler handler) {
        if (corePoolSize < 0 ||
            maximumPoolSize <= 0 ||
            maximumPoolSize < corePoolSize ||
            keepAliveTime < 0)
            throw new IllegalArgumentException();
        if (workQueue == null || threadFactory == null || handler == null)
            throw new NullPointerException();
        this.corePoolSize = corePoolSize;
        this.maximumPoolSize = maximumPoolSize;
        this.workQueue = workQueue;
        this.keepAliveTime = unit.toNanos(keepAliveTime);
        this.threadFactory = threadFactory;
        this.handler = handler;
    }

代码中可以看出其中3个构造方法内部都是调用的第4个参数最全的构造方法,

  • corePoolSize 核心线程数,提交任务时,线程总数没达到这个值时不会利用已有的,而是直接创建新线程并把任务交给它
  • maximumPoolSize 最大线程数 当线程总数超过这个值时会进行一个死循环不断尝试获取新任务,超时了就跳出循环死掉
  • keepAliveTime 线程数超过corePoolSize 后开始有用武之地了,在死循环时,等待时间超出这个值就杀死这个线程
  • TimeUnit unit 超时单位
  • workQueue 任务队列,是一个阻塞队列
  • threadFactory 线程工厂 创建Thread对象 主要是设置线程的名称便于跟踪
  • handler 拒绝策略 线程池也有力有不逮的时候,比如说任务队列已经满了,此时不能再入队了,需要策略来处理这个任务

线程池创建好了,此时我们发现代码中现在只是初始化了一下变量,没有其他动作,线程池起码得先有线程啊,不急。
ThreadPoolExecutor初始状态下是不会创建线程的,线程是在任务提交的过程中一个个创建的,不是批量创建的

提交任务

ThreadPoolExecutor的提交任务主要有3种

public Future<?> submit(Runnable task) {
        if (task == null) throw new NullPointerException();
        RunnableFuture<Void> ftask = newTaskFor(task, null);
        execute(ftask);
        return ftask;
    }
    public <T> Future<T> submit(Runnable task, T result) {
        if (task == null) throw new NullPointerException();
        RunnableFuture<T> ftask = newTaskFor(task, result);
        execute(ftask);
        return ftask;
    }
    public <T> Future<T> submit(Callable<T> task) {
        if (task == null) throw new NullPointerException();
        RunnableFuture<T> ftask = newTaskFor(task);
        execute(ftask);
        return ftask;
    }

处理任务(执行前)

可以看到这3种方法最终调用的都是execute方法,execute方法的参数是一个Runnable接口,而这3个方法对入参都进行了一下包装,最终返回了一个Future对象用以跟踪任务执行情况。当然我们也可以直接用execute方法来提交任务,但与无论是语义理解上还是程序扩展上submit都更好一些
Future对象的探究放到后面,我们先来看下execute是如何交付任务的

public void execute(Runnable command) {
 	//交付的任务不能是空指针
        if (command == null)
            throw new NullPointerException();
        int c = ctl.get();
        //如果当前线程数小于核心配置 则直接加一个线程进去
        // 由于提交任务可能是并发执行的  所以有可能发生不同步情况  但并不影响线程池的整体执行任务情况   所以这里没必要加锁
        if (workerCountOf(c) < corePoolSize) {
           //若是线程加成功了 则目的达到  退出即可  当然也有系统限制线程数不足或者其他意外情况都可能失败  此时进入下一步尝试进入等待队列
            if (addWorker(command, true))
                return;
             //更新一下数据
            c = ctl.get();
        }
        //上一步中 线程数已达到核心配置或者是增加线程失败  此时要尝试进入等待队列中 等待处理
        if (isRunning(c) && workQueue.offer(command)) {
            int recheck = ctl.get();
            //若是入队成功需要再检查一下线程池状态, 不在运行状态时要把任务移出队列 并执行拒绝策略
            if (! isRunning(recheck) && remove(command))
                reject(command);
              // 入队成功并且线程池状态正常  此时可能没有线程池来处理了   要加一个新线程进去
              // 即使由于并行原因判断失误  判断为0后在增加新线程前 其他调用线程也执行到了这里也加了一个新线程进去  也没关系
              // 多加几个新线程没什么影响  多出的线程空转自己玩一会会自己进入火葬场的   在这里我们只需要保证线程数不能少即可  宁可信其无  不可信其有
            else if (workerCountOf(recheck) == 0)
                addWorker(null, false);
        }
        //第一步尝试加新线程没成功   第二步尝试入队也没成功  任务成了没人要的孩子   需要找个备用保姆  交给预先定义的拒绝策略
        else if (!addWorker(command, false))
            reject(command);
    }

execute逻辑可以总结为3步
第一步:尝试增加新线程处理新任务
第二步:不能增加线程或者是增加新线程失败了,再尝试进行押进等待队列中等待处理
第三步:一、二步都没成功处理掉任务,那么需要将任务打包一下拒绝掉

execute方法体代码量并不多,都是调用的其他方法:

  • ctl.get() 返回状态变量
  • workerCountOf() 获取当前工作线程总数
  • isRunning() 判断当前是否处于运行中状态
  • workQueue.offer(command) 任务入队
  • remove(command)
  • reject(command) 拒绝任务
  • addWorker(command, boolean) 添加新线程

我们不按照顺序一个个解释,先拿最简单的解释
前3个方法都是对线程池状态的判断,后面我会集中介绍,在此直接按照函数语义理解即可

第二步中调用offer方法入队,这不是个阻塞方法,成功了返回true 失败了返回false ,具体逻辑由BlockingQueue的实现类实现,主要利用了他们的线程安全性,与线程池的其他特性没啥关系,在此不做过多解释,有意者可以去看下他们的源码
任务出队时先调用了队列本身的remove方法,不多说,tryTerminate()放到后面关闭线程中时再说明

public boolean remove(Runnable task) {
        boolean removed = workQueue.remove(task);
        tryTerminate(); // In case SHUTDOWN and now empty
        return removed;
    }

简单方法解释完再来看复杂的addWorker方法,它是一个异步执行任务核心方法
方法体中直接实现了

private boolean addWorker(Runnable firstTask, boolean core) {
		//(1)循环CAS操作,将线程池中的线程数+1. 这里不多见的使用了类似goto写法  便于跳出循环重复执行
        retry:      
        for (;;) {
            int c = ctl.get();
            int rs = runStateOf(c);

            // 检查一下线程池状态关了没,实现SHUTDOWN 以及后面状态下不再接受新任务的特性
            //但若是此时仍然是SHUTDOWN 状态  并且新任务不是null 且工作队列不为空时仍可以添加线程
            if (rs >= SHUTDOWN &&
                ! (rs == SHUTDOWN &&
                   firstTask == null &&
                   ! workQueue.isEmpty()))
                return false;

            for (;;) {
                int wc = workerCountOf(c);
                //判断线程数量是不是超了
                //线程数到达理论上限则加线程失败 
                // 根据core参数判断  core true   超过corePoolSize 退出  flase  超过maximumPoolSize退出
                if (wc >= CAPACITY ||
                    wc >= (core ? corePoolSize : maximumPoolSize))
                    return false;
                 //CAS修改clt的值+1,在线程池中为将要添加的线程流出空间,成功退出cas循环,失败继续
                if (compareAndIncrementWorkerCount(c))
                    break retry;
                c = ctl.get();  // Re-read ctl
                //若是发现线程池状态改变则再次尝试cas增加线程,一直等到状态恢复了外层循环检测到的状态
                if (runStateOf(c) != rs)
                    continue retry;
                // else CAS failed due to workerCount change; retry inner loop
            }
        }
		 //(2)新建线程,并加入到线程池workers中。
        boolean workerStarted = false;
        boolean workerAdded = false;
        Worker w = null;
        try {
            final ReentrantLock mainLock = this.mainLock;
            //加一个新工作线程对象,虽然firstTask有可能是空的
            w = new Worker(firstTask);
            final Thread t = w.thread;
            if (t != null) {
                mainLock.lock();
                try {
                    // Recheck while holding lock.
                    // Back out on ThreadFactory failure or if
                    // shut down before lock acquired.
                    int c = ctl.get();
                    int rs = runStateOf(c);
                    //线程池运行状态下  或者关闭状态下firstTask是空的 时才把线程加到工作组中
                    if (rs < SHUTDOWN ||
                        (rs == SHUTDOWN && firstTask == null)) {
                        //线程是new出来的  还没启动 此时发现他启动了那就不正常了
                        if (t.isAlive()) // precheck that t is startable
                            throw new IllegalThreadStateException();
                         //加到工作组中
                        workers.add(w);
                        //largestPoolSize更新   由于此时加了全局锁  不用担心出现数据不一致
                        int s = workers.size();
                        if (s > largestPoolSize)
                            largestPoolSize = s;
                        workerAdded = true;
                    }
                } finally {
                    mainLock.unlock();
                }
//                运行到这里代表上面线程加到工作组中成功了 此时启动线程
                if (workerAdded) {
                    t.start();
                    workerStarted = true;
                }
            }
        } finally {
                //workerStarted为true代表线程启动指令也发出成功了 为false代表 start()方法出现了异常需要进入addWorkerFailed()方法中将刚加进去的线程移除掉
            if (! workerStarted)
                addWorkerFailed(w);
        }
        return workerStarted;
    }
     private void addWorkerFailed(Worker w) {
        final ReentrantLock mainLock = this.mainLock;
        mainLock.lock();
        try {
            //移除掉线程并且工作数量恢复实际数字(cas减)
            if (w != null)
                workers.remove(w);
            decrementWorkerCount();
            tryTerminate();
        } finally {
            mainLock.unlock();
        }
    }

执行任务

任务交付完毕后线程也就启动成功,此时线程随机执行Work对象中的run()方法,里面调用了ThreadPoolExecutor的runWorker()方法,传入该work对象,runWorker方法中执行work对象中的Runnable对象的run方法,并在执行前后进行监控执行过程。
addWorker执行完毕后调用的submit方法也就即将返回了,后面的执行任务就是真正的异步了,这里将线程启动后,线程异步去拿任务的过程需要看下类Worker的源码,并不是很长

private final class Worker
        extends AbstractQueuedSynchronizer
        implements Runnable
    {
        private static final long serialVersionUID = 6138294804551838833L;

        /** Thread this worker is running in.  Null if factory fails. */
        final Thread thread;
        /** Initial task to run.  Possibly null. */
        Runnable firstTask;
        /** Per-thread task counter */
        volatile long completedTasks;

        /**
         * Creates with given first task and thread from ThreadFactory.
         * @param firstTask the first task (null if none)
         */
        Worker(Runnable firstTask) {
          //设置同步器的state
            setState(-1); // inhibit interrupts until runWorker
            this.firstTask = firstTask;
            this.thread = getThreadFactory().newThread(this);
        }

        /** Delegates main run loop to outer runWorker  */
        public void run() {
        //runWorker方法是THrealPoolExecutor实现的
            runWorker(this);
        }

        // Lock methods
        //
        // The value 0 represents the unlocked state.
        // The value 1 represents the locked state.

        protected boolean isHeldExclusively() {
            return getState() != 0;
        }

        protected boolean tryAcquire(int unused) {
            if (compareAndSetState(0, 1)) {
                setExclusiveOwnerThread(Thread.currentThread());
                return true;
            }
            return false;
        }

        protected boolean tryRelease(int unused) {
            setExclusiveOwnerThread(null);
            setState(0);
            return true;
        }

        public void lock()        { acquire(1); }
        public boolean tryLock()  { return tryAcquire(1); }
        public void unlock()      { release(1); }
        public boolean isLocked() { return isHeldExclusively(); }

        void interruptIfStarted() {
            Thread t;
            if (getState() >= 0 && (t = thread) != null && !t.isInterrupted()) {
                try {
                    t.interrupt();
                } catch (SecurityException ignore) {
                }
            }
        }
    }

Worker加到工作组中并且启动成功后 start的是里面的Thread ,而传给Thread构造参数的Runnable是它本身,因为其已经实现了Runnable接口,因此线程最终调用了Worker的run方法,run方法里面又调用了ThreadPoolExecutor的runWorker方法,

final void runWorker(Worker w) {
        Thread wt = Thread.currentThread();
        Runnable task = w.firstTask;
        w.firstTask = null;
        //先解锁一次  暂不知道为啥
        w.unlock(); // allow interrupts
        boolean completedAbruptly = true;
        try {
        //若是设置了允许核心线程超时时间或者线程总数超过核心线程数,则getTask()方法里面调用的是阻塞队列的,poll(long timeout, TimeUnit unit)方法,否则会调用take方法
            while (task != null || (task = getTask()) != null) {
                w.lock();
                // If pool is stopping, ensure thread is interrupted;
                // if not, ensure thread is not interrupted.  This
                // requires a recheck in second case to deal with
                // shutdownNow race while clearing interrupt
                if ((runStateAtLeast(ctl.get(), STOP) ||
                     (Thread.interrupted() &&
                      runStateAtLeast(ctl.get(), STOP))) &&
                    !wt.isInterrupted())
                    wt.interrupt();
                try {
                    //beforeExecute可自行扩展
                    beforeExecute(wt, task);
                    Throwable thrown = null;
                    try {
                        task.run();
                    } catch (RuntimeException x) {
                        thrown = x; throw x;
                    } catch (Error x) {
                        thrown = x; throw x;
                    } catch (Throwable x) {
                        thrown = x; throw new Error(x);
                    } finally {
                        //执行任务完毕后无论成功与否都要调用可扩展的afterExecute
                        afterExecute(task, thrown);
                    }
                } finally {
                    task = null;
                    //完成任务数加一  无论任务是否出现异常  在这里可发现若是任务运行失败了不会重新入队  即只会运行一次
                    w.completedTasks++;
                    w.unlock();
                }
            }
            completedAbruptly = false;
        } finally {
          //清理线程  若是不允许核心线程超时并且核心线程数没有超配置 则及时任务队列空了 也会阻塞到getTask()方法处  不会运行到这里
            processWorkerExit(w, completedAbruptly);
        }
    }

清理线程

private void processWorkerExit(Worker w, boolean completedAbruptly) {
        if (completedAbruptly) // If abrupt, then workerCount wasn't adjusted
            decrementWorkerCount();

        final ReentrantLock mainLock = this.mainLock;
        mainLock.lock();
        try {
        //	线程清理时才会统计完成的任务数  jdk应该是为了提高效率才会在这里归总完成任务数  正在运行的线程不会计入 
        // 并且阻塞的核心线程不会加到这里来  
            completedTaskCount += w.completedTasks;
            workers.remove(w);
        } finally {
            mainLock.unlock();
        }
//      在对线程池有负效益的操作时,都需要“尝试终止”线程池
        tryTerminate();

        int c = ctl.get();
          //如果状态是running、shutdown,即tryTerminate()没有成功终止线程池,尝试再添加一个worker
        if (runStateLessThan(c, STOP)) {
        //不是突然完成的,即没有task任务可以获取而完成的,计算min,并根据当前worker数量判断是否需要addWorker()
            if (!completedAbruptly) {
             //allowCoreThreadTimeOut默认为false,即min默认为corePoolSize
                int min = allowCoreThreadTimeOut ? 0 : corePoolSize;
                //如果min为0,即不需要维持核心线程数量,且workQueue不为空,至少保持一个线程
                if (min == 0 && ! workQueue.isEmpty())
                    min = 1;
                     //如果线程数量大于最少数量,直接返回,否则下面至少要addWorker一个
                if (workerCountOf(c) >= min)
                    return; // replacement not needed
            }
            addWorker(null, false);
        }
    }