redis的rehash

  • 什么是rehash
  • rehash的步骤


什么是rehash

众所周知,redis在项目中时长被用来存放缓存信息,是由位桶组成的,随着缓存信息越来越大,这时候就需要对redis进行扩容。然而,之前已经存在的键值对是redis经过hash计算计算出的值来存放在对应的位桶上的,此时扩容需要对之前的键值对进行重新计算也就是rehash。

rehash的步骤

1.为 ht[1] 分配空间, 让字典同时持有 ht[0] 和 ht[1] 两个哈希表。

2.在字典中维持一个索引计数器变量 rehashidx , 并将它的值设置为 0 , 表示 rehash 工作正式开始。

3.在 rehash 进行期间, 每次对字典执行添加、删除、查找或者更新操作时, 程序除了执行指定的操作以外, 还会顺带将 ht[0] 哈希表在 rehashidx 索引上的所有键值对 rehash 到 ht[1] , 当 rehash 工作完成之后, 程序将 rehashidx 属性的值增一。

4.随着字典操作的不断执行, 最终在某个时间点上, ht[0] 的所有键值对都会被 rehash 至 ht[1] , 这时程序将 rehashidx 属性的值设为 -1 , 表示 rehash 操作已完成。

redis集群参数配置文件 redis集群rehash_缓存


redis集群参数配置文件 redis集群rehash_哈希算法_02


redis集群参数配置文件 redis集群rehash_redis_03


redis集群参数配置文件 redis集群rehash_缓存_04


redis集群参数配置文件 redis集群rehash_缓存_05


redis集群参数配置文件 redis集群rehash_redis_06

因为在进行渐进式 rehash 的过程中, 字典会同时使用 ht[0] 和 ht[1] 两个哈希表, 所以在渐进式 rehash 进行期间, 字典的删除(delete)、查找(find)、更新(update)等操作会在两个哈希表上进行: 比如说, 要在字典里面查找一个键的话, 程序会先在 ht[0] 里面进行查找, 如果没找到的话, 就会继续到 ht[1] 里面进行查找, 诸如此类。
另外, 在渐进式 rehash 执行期间, 新添加到字典的键值对一律会被保存到 ht[1] 里面, 而 ht[0] 则不再进行任何添加操作: 这一措施保证了 ht[0] 包含的键值对数量会只减不增, 并随着 rehash 操作的执行而最终变成空表