这篇文章看下来是对ThreadLocal内存泄漏问题解释的最清楚的,也是最佳使用实践指导


ThreadLocal引用对象存在两处:ThreadLocal tl = new ThreadLocal; ThreadMap

ThreadMap跟着Thread,Thread如果在线程池中,则不会销毁栈中的引用对象;

所以ThreadLocal对象存在内存泄漏的情况,Map中设计成弱引用则可避免,但未解决value的内存泄漏(1)

jdk在ThreadLocal的get(),set(),remove()的时候都会清除线程ThreadLocalMap里所有key为null的value。(注意,是使之失效,下次gc时回收)但仍存在阶段的泄漏风险(2)

故最佳实践:每次使用完ThreadLocal,都调用它的remove()方法,

深入分析 ThreadLocal 内存泄漏问题_线程池

(1)避免key的泄漏

(2)避免value的泄漏

可以看到jdk设计是比较严谨安全的,假定程序员set完了不会remove(如果ThreadLocal ref修饰为static,则必须remove ThreadLocal为什么要设计成private static




前言

​ThreadLocal​​ 的作用是提供线程内的局部变量,这种变量在线程的生命周期内起作用,减少同一个线程内多个函数或者组件之间一些公共变量的传递的复杂度。但是如果滥用 ​​ThreadLocal​​,就可能会导致内存泄漏。下面,我们将围绕三个方面来分析 ​​ThreadLocal​​ 内存泄漏的问题


  • ThreadLocal
    实现原理
  • ThreadLocal
    为什么会内存泄漏
  • ThreadLocal
    最佳实践

ThreadLocal 实现原理

深入分析 ThreadLocal 内存泄漏问题_弱引用_02

​ThreadLocal​​的实现是这样的:每个​​Thread​​ 维护一个 ​​ThreadLocalMap​​ 映射表,这个映射表的 ​​key​​ 是 ​​ThreadLocal​​ 实例本身,​​value​​ 是真正需要存储的​​Object​​。也就是说 ​​ThreadLocal​​ 本身并不存储值,它只是作为一个 ​​key​​ 来让线程从 ​​ThreadLocalMap​​ 获取 ​​value​​。值得注意的是图中的虚线,表示​​ThreadLocalMap​​ 是使用 ​​ThreadLocal​​ 的弱引用作为 ​​Key​​ 的,弱引用的对象在 GC 时会被回收。

ThreadLocal为什么会内存泄漏

​ThreadLocalMap​​使用​​ThreadLocal​​的弱引用作为​​key​​,如果一个​​ThreadLocal​​没有外部强引用来引用它,那么系统 GC 的时候,这个​​ThreadLocal​​势必会被回收,这样一来,​​ThreadLocalMap​​中就会出现​​key​​为​​null​​的​​Entry​​,就没有办法访问这些​​key​​为​​null​​的​​Entry​​的​​value​​,如果当前线程再迟迟不结束的话,这些​​key​​为​​null​​的​​Entry​​的​​value​​就会一直存在一条强引用链:​​Thread Ref -> Thread -> ThreaLocalMap -> Entry -> value​​永远无法回收,造成内存泄漏。其实,​​ThreadLocalMap​​的设计中已经考虑到这种情况,也加上了一些防护措施:在​​ThreadLocal​​的​​get()​​,​​set()​​,​​remove()​​的时候都会清除线程​​ThreadLocalMap​​里所有​​key​​为​​null​​的​​value​​。

但是这些被动的预防措施并不能保证不会内存泄漏:


  • 使用线程池的时候,这个线程执行任务结束,ThreadLocal
    对象被回收了,线程放回线程池中不销毁,1 这个线程一直不被使用,导致内存泄漏
  • 2 分配使用了ThreadLocal又不再调用get(),set(),remove()方法,那么这个期间就会发生内存泄漏​。

为什么使用弱引用

从表面上看内存泄漏的根源在于使用了弱引用。网上的文章大多着重分析为什么会内存泄漏,但是另一个问题也同样值得思考:为什么使用弱引用?为什么不用强引用?

static class Entry extends WeakReference<ThreadLocal>

我们先来看看官方文档的说法:


To help deal with very large and long-lived usages, the hash table entries use WeakReferences for keys.
为了应对非常大和长时间的用途,哈希表使用弱引用的 key。


下面我们分两种情况讨论:


  • key 使用强引用:引用的ThreadLocal
    的对象被回收了,但是ThreadLocalMap
    还持有ThreadLocal
    的强引用,如果没有手动删除,ThreadLocal
    不会被回收,导致Entry
    内存泄漏。
  • key 使用弱引用:引用的ThreadLocal
    的对象被回收了,由于ThreadLocalMap
    持有ThreadLocal
    的弱引用,即使没有手动删除,ThreadLocal
    也会被回收。value
    在下一次ThreadLocalMap
    调用set
    ,get
    的时候会被清除。

比较两种情况,我们可以发现:由于​​ThreadLocalMap​​的生命周期跟​​Thread​​一样长,如果都没有手动删除对应​​key​​,都会导致内存泄漏,但是使用弱引用可以多一层保障:弱引用​​ThreadLocal​​不会内存泄漏,对应的​​value​​在下一次​​ThreadLocalMap​​调用​​set​​,​​get​​,​​remove​​的时候会被清除。因此,​​ThreadLocal​​内存泄漏的根源是:由于​​ThreadLocalMap​​的生命周期跟​​Thread​​一样长,如果没有手动删除对应​​key​​就会导致内存泄漏,而不是因为弱引用。

ThreadLocal 最佳实践

综合上面的分析,我们可以理解​​ThreadLocal​​内存泄漏的前因后果,那么怎么避免内存泄漏呢?


  • 每次使用完ThreadLocal
    ,都调用它的remove()
    方法,清除数据。

在使用线程池的情况下,没有及时清理​​ThreadLocal​​,不仅是内存泄漏的问题,更严重的是可能导致业务逻辑出现问题。所以,使用​​ThreadLocal​​就跟加锁完要解锁一样,用完就清理。