最近项目开发中遇到了一些不明的尴尬情况,程序运行很长时间都不退出,导致服务崩溃。经过分析,可能会是sql查询永久性等待(与ORM有关)、maven打包前执行maven clean命令,也可能是还没有想到的原因。。。
为了解决这个大bug,至少在原因明了之前暂时应付。我写了一个监控程序运行时间并强制退出的功能,多少安心了。
附scala代码,java自然也是大同小异的。
import org.joda.time.DateTime import core.traits.LogTrait object ExitKit extends LogTrait { val secondsNum = 1 //s val minuteNum = 60 //s val hourNum = 3600 //s val dayNum = 3600 * 24 //s /** * ms为单位 */ val sleepTime = 10000 /** * 程序异常退出时的code */ val exitCode = 3 def monitorExit() { val excuteTime = sys.props.get("sys.maxExcuteTime") if (excuteTime != None) { logger.info("进行运行时间控制") val timeType = sys.props.getOrElse("sys.timeType", "s").toLowerCase var timeLast = excuteTime.get.toInt logger.info("sys.timeType:{}", timeType) if (timeType == "s") {} else if (timeType == "m") { timeLast = timeLast * minuteNum } else if (timeType == "h") { timeLast = timeLast * hourNum } else if (timeType == "d") { timeLast = timeLast * dayNum } logger.info("sys.maxExcuteTime:" + timeLast + " s") /** * 一个守护线程,如果程序长时间不退出,可以通过它来使程序强行退出,退出时code为 exitCode=3 */ val daemonThread = new Thread(new Runnable { def run() { val start = System.currentTimeMillis() var end = start while (true) { end = System.currentTimeMillis() logger.info("end-start:" + (end - start) / 1000 + " s") /** * 其他地方也可以控制线程是否退出,通过设置sys.othersShut为true */ val othersShut = sys.props.getOrElse("sys.othersShut", "false") if (othersShut == "true") return if ((end - start) / 1000 > timeLast) { try { logger.info("System.exit(3),原因:(end - start) / 1000 > " + timeLast.toString + " --- start:{},end:{}", new DateTime(start).toString("yyyy-MM-dd HH:mm:ss"), new DateTime(end).toString("yyyy-MM-dd HH:mm:ss")) } catch { case t: Throwable => logger.info("System.exit(3),原因:(end - start) / 1000 > " + timeLast.toString) } System.exit(exitCode) } try { Thread.sleep(sleepTime) logger.debug("--- monitorExit 休息{}秒 ---", sleepTime.toString) } catch { case t: Throwable => } } } }) daemonThread.setDaemon(true) println("--thread --- isDaemon? :" + daemonThread.isDaemon) daemonThread.start() } else { logger.info("进行运行时间控制") } } }
功能也不是多么厉害,主要涉及了Daemon
Thread的特性,解决其他线程在规定时间内已经全部退出时,程序自然也应该不再监控运行时间了,应该退出的问题。