1

问题背景

当我们发现线上出现bug,在排查时可能不是很好确认问题,并且最好保留现场,才能重现问题,或者需要快速修复bug,才能比较快速或者方便的临时解决紧急问题。这时,热更新就能很好的帮助我们了。虽然可以通过发版进行解决生产问题,但是项目频繁发版会存在一定的风险:

比如用户正在使用对应功能,会影响用户的使用体验。

紧急版本上线可能还需要领导的特别审核。

等到下一版本再修复,等待的时间可能太久了。

这时如果能热更新线上的部分代码,协助我们尽早的找到问题,并且快速解决bug,快速解决问题也能得到领导和同事的认可,所以需要掌握一定的救火技能是极其必须的。

这里就分享下我的使用经验:最近在排查一个生产线程安全问题,在获取主机连接时,出现不能确定是否获取准确的对应连接,即当前连接的机器是否正确的。

大致流程如下:

java agent 实现热更新 java代码热更新_代码 热更新

这里你可以不理解我的场景需求,只需要看我是怎么使用热更新解决问题即可。

2

排查解决:热更新

我这边需要增加日志打印来确定获取的连接是否正确。那么怎样将线上代码进行热更新呢?

这里还是使用阿里提供的强大工具Arthas帮我们解决问题。

java agent 实现热更新 java代码热更新_java agent 实现热更新_02

1)第一步,修改代码

在代码中增加相应的日志代码,并且将相应的Java代码文件编译成class字节码文件HostFactoryImpl.class。将字节码文件上传到生产服务器。

2)第二步,获取类加载哈希值 启用Arthas,只需要使用java -jar  arthas-boot.jar即可,并且使用sc命令查找对应的字节码文件(因为我们要替换它),并且要找到它的类加载哈希码,因为是类加载器加载类,所以我们需要使用同一个类加载器才行。


java agent 实现热更新 java代码热更新_类加载器_03

以上就是目标类的相关信息。

java agent 实现热更新 java代码热更新_热更新_04

筛选出我们关注的类加载器哈希值。这里为什么有两个?一个是接口,一个是实现类。找到对应的类加载哈希:

38af3868。 3)第三步,替换字节码文件 将刚才上传到服务器的字节码文件加载到JVM中。使用redefine命令进行替换:


java agent 实现热更新 java代码热更新_代码 热更新_05

返回success,说明替换成功!


java agent 实现热更新 java代码热更新_代码 热更新_06

马上去观察日志打印,确实生效了。

但是这是针对 新的请求执行才会生效 ,正在执行的代码还是跟之前一样。 注意:Arthas热更新目前不支持在类增加/删除属性field或方法method操作。 假如你增加了属性或者方法则会出现下面的提示:

java agent 实现热更新 java代码热更新_类加载器_07

3

总结

1)使用Arthas命令:sc和redefine。 2)正在执行的代码不会生效,新的请求执行才会生效。 3)不支持增加或删除属性field和方法method。 往期Arthas生产实战:

Arthas排查生产问题:实例方法接口调用 Arthas 实战生产问题: 真的别再使用TimerTask了!

Arthas官方文档sc命令:https://alibaba.github.io/arthas/sc.html

参考:

https://www.jianshu.com/p/efa46ccdd7f0