下面将依次介绍:
1. 线程状态
2. start方法源码
3. 什么是线程池?
4. 线程池的工作原理和使用线程池的好处
5. ThreadPoolExecutor中的Worker
6. 线程池工具类如Executors等
7. 如何停止一个线程(含代码)
8. 如何合理的配置
9. AQS的子类在各个同步工具类(如ReentrantLock)中的使用情况
线程状态
线程的生命周期:
首先new一个线程对象,进入New状态;
调用线程的start方法线程进入Runnable就绪状态,等待CPU调度(线程想获取锁,自旋一定时间,未获取到锁进入Blocked状态);
然后该线程任务被CPU执行时,处于Running状态,如果放弃了CPU资源(如调用了yield方法),会进入到Runnable状态,等待CPU调度;
执行过程中有block IO(如DataInputStream.readUTF()方法)、sleep、wait、join(join底层调用的Object的wait方法)、condition.await等操作,进入Blocked状态;
与之对应的如果线程处于Blocked状态,block IO 完成、获取到锁(也不会立即被CPU执行),sleep时间完、被notify或notifyALL或condition.singal或condition.singalAll唤醒,由Blocked转为Runnable状态,等待CPU执行;
Terminated结束状态,线程run方法执行完毕、或者异常退出(比如其他线程调用了该线程的 interrupt方法(该方法仅仅只是设置线程标志位),如果该线程正在sleep/wait/join会抛出
InterruptedException异常,线程终止,见本文末尾如何终止一个线程)。
注:Condition可以由ReentrantLock对象的newCondition生成(底层就是内部类Sync继承了AQS,sync对象生成的Condition对象),Condition对象与一个ReentrantLock对象相对应,可以唤醒该ReentrantLock对象对应的Blocked线程。
start 方法源码解析,何时调用的 run() 方法?
- ①:首先,会判断线程的状态是否是 NEW 状态,内部对应的状态标识是个 0,也就是说如果不等于 0,直接抛线程状态异常(所以不能调用start方法超过一次);
- ②:线程在启动后被加入到
ThreadGroup
- ③:
start0
是最核心的方法了,就是运行状态为 NEW - ④:
start0
是个native
方法,也就是 JNI
看到这里,你也许会有个疑问,自己重写的 run 方法是什么时候被调用的呢?源码中也没看到调用啊!!
Causes this thread to begin execution; the Java Virtual Machine calls the run method of this thread.
上面这段截自 JDK 官方文档,意思是说:
run 方法是在调用 JNI 方法 start0()
什么是线程池?线程池的工作原理和使用线程池的好处?
线程池源码里最主要的类:ThreadPoolExecutor;
对该类的源码进行部分解析;
线程池重要的两个状态:
- runState:线程池运行状态
- workerCount:工作线程的数量
线程池用一个32位的int来同时保存runState和workerCount,其中高3位(第31到29位)是runState,其余29位是workerCount(大约500 million);如下图
一个线程池管理了一组工作线程,同时它还包括了一个用于放置等待执行任务的任务队列(阻塞队列)。
默认情况下,在创建了线程池后,线程池中的线程数为 0。
当任务提交给 线程池之后的处理策略如下:
1. 如果此时线程池中的线程数量小于 corePoolSize(核心池的大小),即使线程池中的线程都处于空闲状态,也要创建新的线程来处理被添加的任务(也 就是每来一个任务,就要创建一个线程来执行任务)。
2. 如果此时线程池中的数量大于等于 corePoolSize,但是缓冲队列 workQueue 未满,那么任务被放入缓冲队列,则该任务会等待空闲线程将其 取出去执行。
3. 如 果 此 时 线 程 池 中 的 数 量 大 于 等 于 corePoolSize , 缓 冲 队 列 workQueue 满,并且线程池中的数量小于 maximumPoolSize(线程池 最大线程数),建新的线程来处理被添加的任务。
4. 如果 此时 线程 池中 的数量 大 于 等 于 corePoolSize, 缓 冲 队列 workQueue 满,并且线程池中的数量等于 maximumPoolSize,还有任务需要线程执行,那么通 过 RejectedExecutionHandler 所指定的策略(任务拒绝策略)来处理此任务;也就是处理任务的优先级为:核心线程 corePoolSize、任务队列 workQueue、最大线程 maximumPoolSize,如果三者都满了,使用 handler
5. 特别注意,在 corePoolSize 和 maximumPoolSize 之间的线程 数会被自动释放。当线程池中线程数量大于 corePoolSize 时,如果某线程 空闲时间超过 keepAliveTime,线程将被终止,直至线程池中的线程数目不大于 corePoolSize。这样,线程池可以动态的调整池中的线程数。
6. threadFactory
创建线程的工厂,所有的线程都是通过这个Factory创建的;
默认会使用Executors.defaultThreadFactory
7. handler 线程池的饱和策略。做不了任务了找理由罢工
- AbortPolicy
- 直接抛出异常,默认策略;
- CallerRunsPolicy
- 用调用者所在的线程来执行任务;
- DiscardOldestPolicy
- 丢弃阻塞队列中第一个(即最旧)的任务,并执行当前任务;
- DiscardPolicy
- 直接丢弃任务。
什么是Workder ?
Worker既实现了Runnable,又继承了AbstractQueuedSynchronizer(AQS),所以它既是一个可执行的任务,又可以达到锁的效果。
使用线程池的好处:
1.通过重复利用已创建的线程,减少在创建和销毁线程上所花的时间以及系统资源的开销。
2.提高响应速度。当任务到达时,任务可以不需要等到线程创建就可以立即执行。
分配和监控。
创建大量线程而导致消耗完系统内存。
工具类Executors
对于原理,有几个接口和类值得我们关注:
Executor 接口
Executors 类
ExecutorService 接口
AbstractExecutorService 抽象类
ThreadPoolExecutor 类
Executor 是一个顶层接口,在它里面只声明了一个方法 execute(Runnable),返回 值为 void,参数为 Runnable 类型,从字面意思可以理解,就是用来执行传进去的任务的;
然后 ExecutorService 接口继承了 Executor 接口,并声明了一些方法:submit、 invokeAll、invokeAny 以及 shutDown 等;
抽象类 AbstractExecutorService 实现了 ExecutorService 接口,基本实现了 ExecutorService 中声明的所有方法;
然后 ThreadPoolExecutor
public static ScheduledExecutorService newScheduledThreadPool(int corePoolSize) 创建一个支持定时及周期性的任务执行的线程池,多数情况下可用来替代 Timer 类。
1. newSingleThreadExecutor
单线程的线程池。这个线程池只有一个线程在工作,也就是相当于单线程串行执行所有任务。如果这个唯一的线程因为异常结束,那么会有一个新的线程来替代它。 此线程池保证所有任务的执行顺序按照任务的提交顺序执行。
2.newFixedThreadPool
创建固定大小的线程池。每次提交一个任务就创建一个线程,直到线程达到线程池的 最大大小。线程池的大小一旦达到最大值就会保持不变,如果某个线程因为执行异常而结 束,那么线程池会补充一个新线程。
3. newCachedThreadPool
创建一个可缓存的线程池。如果线程池的大小超过了处理任务所需要的线程,那么就会回收部分空闲(60 秒不执行任务)的线程,当任务数增加时,此线程池又可以智能的添 加新线程来处理任务。此线程池不会对线程池大小做限制,线程池大小完全依赖于操作系 统(或者说 JVM)能够创建的最大线程大小。
public ThreadPoolExecutor(int corePoolSize,int maximumPoolSize,long keepAliveTime,TimeUnit unit, BlockingQueue workQueue,ThreadFactory threadFactory,RejectedExecutionHandler handler);
在 ThreadPoolExecutor 类中有几个非常重要的方法:
execute()
submit()
shutdown()
shutdownNow()
execute 和 submit 区别: submit 有返回值,execute 没有返回值。 所以说可以根据任务有无返回 值选择对应的方法。 submit 方便异常的处理。 如果任务可能会抛出异常,而且希望外面的调 用者能够感知这些异常,那么就需要调用 submit 方法,通过捕获 Future.get
shutdown()和 shutdownNow()的区别: shutdown()和 shutdownNow()是用来关闭线程池的。
不得向线程池再提交任务,如果有空闲线程则销毁空闲线程,等待所有正在执行的任务及位于阻塞队列中的任务执行结束,然后销毁所有线程。
不得向线程池再提交任务,如果有空闲线程则销毁空闲线程,取消所有位于阻塞队列中的任务,并将其放入 List容器,作为返回值;取消正在执行的线程(实际上仅仅是设置正在执行线程的中断标志位,调用线程的 interrupt
如何停止一个线程?
1. 设置标志位
可以用一个boolean类型的变量
2.利用Java线程的中断
和上面的标志位有些许类似;
线程A被其他线程调用了interrupt方法设置线程A的标志位,线程A run方法内部判断Thread.currentThread().isInterrupted(),如果true就停止,前提是线程A不处于sleep/wait/yield/join;
中断可以理解为线程的一个标志位属性,它表示一个运行中的线程是否被其他线程进行了中断操作。
中断好比其他线程对该线程打了个招呼,其他线程通过调用该线程的interrupt()方法对其进行中断操作。
线程通过检查自身是否被中断来进行响应,线程通过方法isInterrupted()来进行判断是否被中断,也可以调用静态方法Thread.interrupted()对当前线程的中断标识位进行复位。
如果该线程已经处于终结状态,即使该线程被中断过,在调用该线程对象的isInterrupted()时依旧会返回false。
run方法执行完毕,线程状态Terminated。
3. 利用抛出InterruptedException的方式
中断可以理解为线程的一个标志位属性,它表示一个运行中的线程是否被其他线程进行了中断操作。
中断好比其他线程对该线程打了个招呼,其他线程通过调用该线程的interrupt()方法对其进行中断操作。
线程通过检查自身是否被中断来进行响应,线程通过方法isInterrupted()来进行判断是否被中断,也可以调用静态方法Thread.interrupted()对当前线程的中断标识位进行复位。如果该线程已经处于终结状态,即使该线程被中断过,在调用该线程对象的isInterrupted()时依旧会返回false。
从Java的API中可以看到,许多声明抛出InterruptedException的方法(例如Thread.sleep(longmillis)方法,当线程在sleep/wait/yield/join时,如果被中断,这个异常就会产生)。
这些方法在抛InterruptedException之前,Java虚拟机会先将该线程的中断标识位清除,然后抛出InterruptedException,此时调用isInterrupted()方法将会返回false。
如何合理的配置 java 线程池?如 CPU 密集型的任务,基本线程池 应该配置多大?IO 密集型的任务,基本线程池应该配置多大?用有界 队列好还是无界队列好?任务非常多的时候,使用什么阻塞队列能获取 最好的吞吐量?
答:
1)配置线程池时,CPU 密集型任务可以少配置线程数,大概和机器的 cpu 核数相 当,可以使得每个线程都在执行任务。
2)IO 密集型任务则由于需要等待 IO 操作,线程并不是一直在执行任务,则配置尽 可能多的线程,2*cpu 核数。
3)有界队列和无界队列的配置需区分业务场景,一般情况下配置有界队列,在一些 可能会有爆发性增长的情况下使用无界队列。
4)任务非常多时,使用非阻塞队列,使用 CAS 操作替代锁可以获得好的吞吐量。 synchronousQueue
参考来源:
http://ifeve.com/java-threadpool/