Redis持久化

RDB持久化

RDB: Redis数据备份文件。简单来说就是把内存中的所有数据都记录到磁盘中。当Redis实例故障重启后,从磁盘读取快照文件,恢复数据。

主要流程

bgsave开始时会fork主进程得到子进程,子进程共享主进程的内存数据。完成fork后读取内存数据并写入RDB文件。fork采用的是copy-on-write技术:

  • 当进程执行读操作时,访问共享内存;
  • 当主进程执行写操作时,则会拷贝一份数据,执行写操作。

总结

  • RDB方式bgsave的基本流程?
  • fork主进程得到一个子进程,共享内存空间;
  • 子进程读取内存数据并写入新的RDB文件;
  • 用新RDB文件替换旧的RDB文件
  • RDB会在什么时候执行?save 60 1000代表什么含义?
  • 默认是服务停止时
  • 代表60秒内至少执行1000次修改则触发RDB
  • RDB的缺点?
  • RDB执行间隔时间长,两次RDB之间写入数据有丢失的风险
  • fork子进程、压缩、写出RDB文件都比较耗时
AOF持久化

AOF全称为 Append Only (追加文件)。Redis处理的每一个写命令都会记录在AOF文件,可以看做是命令日志文件

  • AOF默认是关闭的,需要修改redis.conf配置文件来开启AOF:
  • AOF的命令记录的频率也可以通过redis.conf文件来配

AOF

因为是记录命令,AOF文件会比RDB文件大的多。而且AOF会记录对同一个key的多次写操作,但只有最后一次写操作才有意义。通过执行bgrewriteaof命令,可以让AOF文件执行重写功能,用最少的命令达到相同效果

  • Redis也会在触发阈值时自动去重写AOF文件。阈值也可以在redis.conf中配置。
AOF和RDB比较

RedisGraph 服务进程 redis fork进程_RedisGraph 服务进程

Redis主从

主从数据同步原理

主从第一次同步是全量同步

  • slave节点请求增量同步;
  • master节点判断replid,发现不一致,拒绝增量同步;
  • master将完整内存数据生成RDB,发送RDB到slave;
  • slave清空本地数据,加载master的RDB;
  • master将RDB期间的命令记录在repl_baklog,并持续将log中的命令发送给slave;
  • slave执行接收到的命令,保持与master之间的同步

主从第一次同步是全量同步,但如果slave重启后同步,则执行增量同步

总结

简述全量同步和增量同步区别?

  • 全量同步:master将完整内存数据生成RDB,发送RDB到slave。后续命令则记录在repl_baklog,逐个发送给slave。
  • 增量同步:slave提交自己的offset到master,master获取repl_baklog中从offset之后的命令给slave

什么时候执行全量同步?

  • slave节点第一次连接master节点时;
  • slave节点断开时间太久,repl_baklog中的offset以及被覆盖时

什么时候执行增量同步?

  • slave节点断开又恢复,并且在repl_baklog中能找到offset时