线程池实际使用过程中遇到的问题
运政新库:程序执行一段时间后,就卡住了,不执行后边的任务。
每个文件一个线程,使用一个线程池;文件中,拆分子文件,使用另外一个线程池。
下面分析下外围的线程,也就是每个线程执行一个文件的这个线程池。
1.现象说明:
在运政新库程序中,程序启动后,可以执行处理文件的任务,但是执行一段时间后,程序就卡住了,不再执行新的任务,而且时间不定。
2.分析过程:
数据库:通过查看数据库,发现数据库中并没有挂起或者死锁的sql。
查看CPU:发现linux CPU 基本为0 ,没有占用过多资源。
查看内存:内存的占用基本不变,表示没有去执行新的任务。
查看进程中的线程状态:通过 jstack 打出进程中的线程情况,分析状态,没有RUNNING的,大多为 WAITING、TIME_WAITING、BLOCKED。表示确认程序中没有任务在执行。
通过上面几点,就可以确认,是程序在空载,没有执行任务。
因为使用了线程池,所以,需要判断线程池中的线程的数量、状态等。通过添加日志的方式,对线程池中的内容进行监控。
3.线程池的监控:
通过添加日志的方式,对线程池进行监控
(1)线程池的定义
threadPoolProvince = Executors.newFixedThreadPool(3);
(2)线程池中添加任务
Future future = threadPoolProvince.submit(new Runnable() {
...
(3)添加日志进行监控:
int activeCount = ((ThreadPoolExecutor)threadPoolProvince).getActiveCount();
long completeTaskCount = ((ThreadPoolExecutor)threadPoolProvince).getCompletedTaskCount();
int poolSize = ((ThreadPoolExecutor)threadPoolProvince).getPoolSize();
long taskCount = ((ThreadPoolExecutor)threadPoolProvince).getTaskCount();
long largestPoolSize = ((ThreadPoolExecutor)threadPoolProvince).getLargestPoolSize();
long maximumPoolSize = ((ThreadPoolExecutor)threadPoolProvince).getMaximumPoolSize();
log.info("-->>外围线程池中的参数:activeCount:"+activeCount+",completeTaskCount:"+completeTaskCount+",poolSize:"+poolSize+",taskCount:"+taskCount+",largetPoolSize:"+largestPoolSize+",marximumPoolSize:"+maximumPoolSize);
(4)监控结果:
activeCount:3,completeTaskCount:0,poolSize:3,taskCount:48,largetPoolSize:3,marximu
mPoolSize:3
(5)结果说明:
activeCount:当前线程池中活动的线程数。
completeTaskCount:执行完成的任务数。
poolSize:核心线程数。
taskCount:线程池中的任务总量
largestPoolSize:过去执行过的最多的任务数,可以用于判断线程池是否满过。
maximumPoolSize:线程池中可以存放的最大的线程数。
(6)结果分析:
因为去机器上看了下,待执行的文件还有一百多个,但是线程池中的任务数量只有48个,说明在添加任务的时候出现了问题。
因为 submit 方法,是异步添加,不需要等待返回,所以,不存在问题。
这时,仔细去研究添加任务前后的代码,添加日志进行追踪,发现,在 submit之前,有一个判断
因为是循环中进行submit ,对于不符合条件的,不加入到线程池中,所以,应该结束本次循环,可以啊,这里怎么用的是 break 啊。。。,后边的循环都没有走哎呦喂,改成continue就好了。
所以,这里造成程序执行一段时间之后,就卡死的原因,是因为 执行一段时间后,线程池中的任务都执行完了,所以大多线程都处于WATING状态。
根本原因,就是向线程池中添加任务时出现问题,造成任务添加的少了,线程池空载,程序空载,造成卡死的假象。
(7)总结
线程池 newFixedPoolThread 在机制上是没有问题的,当出现执行一段时间后,出现卡死的状况,需要分析下线程池中的任务数量、线程状态。