如何实现JS真正意义上的弱引用?

作者 | Sathya Gunasekaran, Mathias Bynens 译者 | 刘雅梦 编辑 | Yonie 本文指出WeakMap 和 WeakSet 并不能真正实现弱引用,若想在 JavaScript 中实现真正的弱引用,要通过配合使用 WeakRef 和终结器(Finalizer)来实现。 一般来说,在 JavaScript 中,对象的引用是强保留的,这意味着只要持有对象的引用,它就不会被垃圾回收。

const ref = { x: 42, y: 51 };
// 只要我们访问 ref 对象(或者任何其他引用指向该对象),这个对象就不会被垃圾回收

目前,在 Javascript 中,WeakMap 和 WeakSet 是弱引用对象的唯一方法:将对象作为键添加到 WeakMap 或 WeakSet 中,是不会阻止它被垃圾回收的。

const wm = new WeakMap();
{
  const ref = {};
  const metaData = 'foo';
  wm.set(ref, metaData);
  wm.get(ref);
  // 返回 metaData
}
// 在这个块范围内,我们已经没有对 ref 对象的引用。
// 因此,虽然它是 wm 中的键,我们仍然可以访问,但是它能够被垃圾回收。

const ws = new WeakSet();
ws.add(ref);
ws.has(ref);
// 返回 true

你可以认为 WeakMap.prototype.set(ref, metaData) 是向对象 ref 中添加值为 metaData 的属性:只要你持有对象的引用,就可以获取元数据。一旦不再持有对象的引用,即使你仍持有添加了该对象的 WeakMap 的引用对象,也会被垃圾回收。类似地,可以将 WeakSet 视为 WeakMap 中所有值都是布尔值的一个特例。 JavaScript 的 WeakMap 并 不是真正意义上的弱引用:实际上,只要键仍然存活,它就强引用其内容。WeakMap 仅在键被垃圾回收之后,才弱引用它的内容。这种关系更准确地称为 ephemeron。 WeakRef 是一个更高级的 API,它提供了 真正的弱引用,并在对象的生命周期中插入了一个窗口。让我们一起来看个例子。 假设有一个 getImage 函数,它接受一个 name 入参,并执行一些昂贵的操作来生成另一个对象,比如生成二进制图像数据:

function getImage(name) {
  const image = performExpensiveOperation(name);
  return image;
}

为了提高性能,我们将图像保存在缓存中。现在,我们不必再为相同的入参执行昂贵的操作了!

const cache = new Map();

function getImageCached(name) {
  if (cache.has(name)) return cache.get(name);
  const image = performExpensiveOperation(name);
  cache.set(name, image);
  return image;
}

但是,这里存在一个问题。Map 会强保留它的键和值,因此,图像名称和数据永远不会被垃圾回收。这会逐步增加内存占用,最终导致 内存泄漏! WeakRef 通过创建图像对象的弱引用并将弱引用保存在缓存中(而不是保存图像对象本身)来解决内存泄漏问题。这样,垃圾回收器就可以清除没有强引用的图像对象了。

const cache = new Map();

function getImageCached(name) {
  const ref = cache.get(name);
  if (ref !== undefined) {
    const deref = ref.deref();
    if (deref !== undefined) return deref;
  }
  const image = performExpensiveOperation(name);
  const wr = new WeakRef(image);
  cache.set(name, wr);
  return image;
}

但这里仍然存在一个问题:Map 仍然永远保留 name 的字符串,因为这些字符串是缓存中的键。理想情况下,这些字符串也要被删除。WeakRef 提案中也提供了一个解决方案!通过新的 FinalizationGroup API,我们可以注册一个回调,以便在垃圾回收器回收已注册的对象时运行。这种回调称为 终结器(Finalizers)。 注意:在垃圾回收器回收图像对象之后,终结回调不会立即运行。它可能在将来某个时候运行,甚至根本不运行——规范并不保证它一定运行!编写代码时,请注意这一点。 在此,我们注册一个回调,以便在图像对象被垃圾回收时从缓存中删除键:

const cache = new Map();

const finalizationGroup = new FinalizationGroup((iterator) => {
  for (const name of iterator) {
    const ref = cache.get(name);
    if (ref !== undefined && ref.deref() === undefined) {
      cache.delete(name);
    }
  }
});

注意:ref !== undefined && ref.deref() === undefined 是必需的,因为在旧 WeakRef 进入终结回调队列和实际运行终结回调之间,可能已经添加了同一个 name 的新 WeakRef。 我们的最终实现如下:

const cache = new Map();

const finalizationGroup = new FinalizationGroup((iterator) => {
  for (const name of iterator) {
    const ref = cache.get(name);
    if (ref !== undefined && ref.deref() === undefined) {
      cache.delete(name);
    }
  }
});

function getImageCached(name) {
  const ref = cache.get(name); // 1
  if (ref !== undefined) { // 2
    const deref = ref.deref();
    if (deref !== undefined) return deref;
  }
  const image = performExpensiveOperation(name); // 3
  const wr = new WeakRef(image); // 4
  cache.set(name, wr); // 5
  finalizationGroup.register(image, name); // 6
  return image; // 7
}

给定一个图像名称(入参),我们在缓存中查找其对应的弱引用(1)。如果弱引用仍然指向某个对象(2),那么我们就返回缓存的图像数据。如果该图像名称对应的弱引入没有在缓存中,或者缓存的图像数据被垃圾回收了,那么我们计算图像数据(3),创建一个新的弱引用(4),将图像名称和弱引用保存到缓存中(5),注册一个终结器,一旦图像数据被垃圾回收,该终结器就删除缓存中图像名称(6),最后返回图像(7)。

过犹不及

听到这些新功能之后,可能会忍不住想要尝试 WeakRef 的所有这些功能(All The Things™)。不过,这可能不是个好主意。对于 WeakRef 和终结器来说,有很多明显不好的使用案例。 一般来说,不要编写依靠垃圾回收器清理 WeakRef 或者在任何可预测的时间调用终结器的代码——这是不可能的! 例如,不要在终结器的代码块中放置重要的逻辑。因为,无法预测什么时候,甚至不确定是否会调用给定的终结器。最好将 WeakRef 和终结器视为 渐进式增强:如果自定义终结器代码运行了,那最好;但是,在它没有运行的情况下,程序应该仍然可以正常运行。 WeakRef 和终结器可以帮助我们节省内存,并且在被当一种作渐进式增强的手段少量使用时,效果最佳。由于它们是高级用户特性,我们期望尽量只在框架或库中使用它们。

WeakRef 支持

关于此功能的支持列表: https://v8.dev/features/support 英文原文: https://v8.dev/features/weak-references