文章目录

  • 1. redo和undo日志,分别有什么用
  • 2. 概念介绍
  • 3.存储位置
  • 4. 回滚操作
  • 5.删除方式
  • 6. 空间分配
  • 7. 那么insert语句的undo log日志到底长什么样子呢?
  • 8.其他


1. redo和undo日志,分别有什么用

  • redo日志:数据修改之后记录的值,可以用来恢复未写入data file的已成功事务更新的数据
  • undo日志:记录某数据被修改前的值,可以用来在事务失败时进行rollback;

数据库存放数据的文件,本文称其为data file。

数据库的内容在内存里是有缓存的,这里命名为db buffer。
某次操作,我们取了数据库某表格中的数据,这个数据会在内存中缓存一些时间。
对这个数据的修改在开始时候也只是修改在内存中的内容。
当db buffer已满或者遇到其他的情况,这些数据会写入data file。

2. 概念介绍

我们知道,MySQL中的redo日志记录了事务的行为,在服务器宕机的时候,可以通过重做事务来达到恢复数据的目的,然而,有的时候,事务还有回滚的需求,也就是说,我们需要知道某条在变成当前情况之前的样子,这种情况下,undo日志就派上用场了。

也就是说,undo日志是为了将数据恢复到修改之前的样子,因此在对数据库进行修改的时候,我们需要知道,这个过程中会产生redo日志和undo日志。

3.存储位置

我们还知道,redo日志一般情况下放在redo日志文件中,也就是常说的ib_log中,而undo日志存放在数据库内部的一个"段"中,这个概念,我们在8月21号的文章中有讲过,忘记的同学可以回去看看,undo日志的段位于共享表空间内。

4. 回滚操作

现在,我们已经知道了undo的概念,其实就是共享表空间中的一块区域,它的主要作用是将事务恢复到执行修改之前的样子,但是,恢复的情况一般分为两种,一种是逻辑恢复,一种是物理恢复,这里需要非常强调的是,undo的恢复是逻辑恢复,也就是说,如果你插入了100w条数据,导致innodb分配了一个新的数据页来存储这些数据,那么在事务进行回滚的时候,undo的功能并不是回收这个数据页,而是将这些insert的操作,改变成delete的操作从而执行回滚。在这个过程中,共享表空间的大小并不会发生改变。除此之外,undo日志会将delete操作转化为insert操作,update操作转化为反向的update操作

5.删除方式

还有一点需要注意,事务共享表空间中写入undo日志的过程同样需要写入redo日志,事务一旦提交,也就意味着事务的持久性生效,那么undo日志则不被需要,但是innodb并不会把这个undo日志直接删除,而是放在一个undo日志的链表中,到底什么时候删除取决于mysql的purge线程,这样做是为了避免其他的事务需要通过undo日志来得到这条记录之前的版本。

6. 空间分配

在实际操作中,一个数据库实例上可能会进行很多事务,如果我们为每一个事务都分配单独的日志数据页来保存undo将会非常的浪费存储空间,我们简单算一算,假设一个应用的TPS为1000,为每个事务分配一个undo页,我们之后到一个数据页的大小是16kb,1分钟将会产生60*1000个数据页,那么一分钟大约需要的空间就是960M的磁盘空间,这样显然是不合理的,因此,在innodb中,对于undo页可以进行重用,具体的方法是,事务提交的时候,现将undo页放入链表中,然后判断这个undo页的使用空间是否小于75%,如果是的话,那么这个undo页就可以被重用,之后的undo日志就可以追加在当前undo日志的后面。当然,我们可以通过show engine innodb status来查看链表中undo log 的数量

7. 那么insert语句的undo log日志到底长什么样子呢?

insert语句的undo log的类型是TRX_UNDO_INSERT_REC,这个undo log里面包含了以下一些东西:

  • 这条日志的开始位置
  • 主键的各列长度和值
  • 表id
  • undo log日志编号,每个事务里的undo log日志的编号都是从0开始的,然后一次递增
  • undo log日志类型
  • mysql undo002 很大 mysql undo文件_postgresql

  • 有了这些数据undo log里就知道在哪个表里插入的数据,主键是什么,直接定位到那个表和主键对应的数据页,从里面删除之前insert语句插入进去的数据,这样就实现了事务回滚效果!

8.其他

检查点checkpoint
checkpoint是为了定期将db buffer的内容刷新到data file。当遇到内存不足、db buffer已满等情况时,需要将db buffer中的内容/部分内容(特别是脏数据)转储到data file中。在转储时,会记录checkpoint发生的”时刻“。在故障回复时候,只需要redo/undo最近的一次checkpoint之后的操作。

幂等性问题
在日志文件中的操作记录应该具有幂等性。幂等性,就是说同一个操作执行多次和执行一次,结果是一样的。例如,51 = 5111,所以对5的乘1操作具有幂等性。日志文件在故障恢复中,可能会回放多次(比如第一次回放到一半时系统断电了,不得不再重新回放),如果操作记录不满足幂等性,会造成数据错误。