ACID实现
事务(Transaction)实现着重于实现事务的ACID属性,即:原子性(Atomic)
一致性(Consistency)
隔离性(Isolation)
持久性(Duration)
事务的隔离性由锁机制和MVCC实现,原子性(Atomic)由Undo Log实现,持久性由Redo Log实现,一致性由Undo Log和Redo Log共同实现(即:数据库总是从一个一致状态转移到另一个一致状态)。
Redo Log
重做日志(Redo Log)用来实现事务的持久性(Duration),记录每次操作上页的物理修改。
解决问题
InnoDB存储引擎的存储数据存放在磁盘中,同时提供内存缓存(Buffer Pool)包含磁盘中部分数据页的映射,作为数据库访问的缓冲。Buffer Pool中修改的脏页数据会定期刷新到磁盘中。
==如果MySQL宕机,而Buffer Pool的数据没有完全刷新到磁盘,就会导致数据丢失,无法保证持久性。 因此引入Redo Log解决这个问题。==当数据修改时,首先写入Redo Log,再更新到Buffer Pool,保证数据不会因为宕机而丢失,保证持久性。
当事务提交时会调用fsync将redo log刷至磁盘持久化。MySQL宕机时,通过读取Redo Log中的数据,对数据库进行恢复。
==Redo Log也是记录在磁盘中,为什么会比直接将Buffer Pool写入磁盘更快?==Buffer Pool刷入脏页至磁盘是随机IO,每次修改的数据位置随机,而Redo Log永远在页中追加,属于顺序IO。
Buffer Pool刷入磁盘是以数据页为单位,每次都需要整页写入。而Redo Log只需要写入真正物理修改的部分,IO数据量大大减少。
Redo Log实现
redo log由两部分组成:内存中的重做日志缓冲(redo log buffer)
重做日志文件(redo log file)
InnoDB通过Force Log at Commit机制保证持久性:当事务提交(COMMIT)时,必须先将该事务的所有日志缓冲写入到重做日志文件进行持久化,才能COMMIT成功。
为了确保每次日志都写入重做日志文件,在每次将重做日志缓冲写入重做日志文件后,InnoDB存储引擎都需要调用一次fsync操作。因此,磁盘的性能决定了事务提交的性能,也就是数据库的性能。
innodb_flush_log_at_trx_commit参数控制重做日志刷新到磁盘的策略:0,事务提交时不进行写入重做日志操作,仅在master thread每秒进行一次。
1,事务提交时必须调用一次fsync操作。
2,仅写入文件系统缓存,不进行fsync操作。
log buffer根据如下规则写入到磁盘重做日志文件中:事务提交时
当log buffer中有一半的内存空间已经被使用
log checkpoint时
log block
重做日志以512字节进行存储,重做日志缓存、重做日志文件都是以块(block)的方式进行保存的,称为重做日志块(redo log block)。
重做日志块由:日志快头(log block header)、日志、日志快尾(log block tailer)三部分组成。
log block header占用12个字节,log block tailer占用8个字节,因此重做日志在每个重做日志块中占用512 - 12 - 8 = 492个字节。
redo log file 重做日志文件
重做日志文件存储在log buffer中保存的log block,因此其也是根据块的方式进行物理存储,每个块的大小同样为512字节。
写入log block时在redo log file最后进行追加,当一个redo log file被写满时,会接着写入下一个redo log file。
InnoDB存储引擎的存储管理基于页,因此重做日志格式也是基于页的,对于不同的操作类型,InnoDB有不同的重做日志格式,InnoDB 1.2版本时,总共有51种重做日志类型。
虽然重做日志格式不同,但是有同样的通用头部格式:redo_log_type : 重做日志类型
space : 表空间ID
page_no : 页偏移量
log group
log group是重做日志组,其中有多个重做日志文件,是一个逻辑上的概念。在InnoDB中只有一个log group。
通过Redo Log恢复
InnoDB存储引擎在启动时不管上次数据库是否正常关闭,都会尝试进行恢复操作。
重做日志记录的是页的物理修改,因此其恢复速度比二进制日志快很多。
如对table:
CREATE TABLE t ( a INT, b INT, PRIMARY KEY(a), KEY(b) );
执行SQL语句:
INSERT INTO t SELECT 1,2;
其记录的重做日志大致为:
page(2,3), offset 32, value 1,2 # 聚集索引
page(2,4), offset 54, value 2 # 辅助索引
Log Sequence Number LSN
LSN日志序列号占用8字节,记录重做日志当前总字节量,是单调递增的。
LSN不仅记录在重做日志中,还存在于每个页中,在每个页的头部,值FIL_PAGE_LSN记录该页的LSN。表示页最后刷新时LSN的大小。
数据库启动时,页中的LSN用来判断页是否需要进行恢复操作:重做日志LSN > 页中LSN,需要进行恢复操作。
重做日志LSN < 页中LSN,不许进行恢复操作。
SHOW ENGINE INNODB STATUS可以查看当前数据库LSN情况。
Undo Log
Undo Log(回滚日志)用来实现事务的原子性(回滚)和隔离性(MVCC)。
Undo Log和Redo Log正好相反,记录的是数据被修改前的信息,并且只记录逻辑变化,基于Undo Log进行的回滚只是对数据库进行一个相反的操作,而不是直接恢复物理页。
针对每个DELETE操作,生成Insert Log插入Undo Log。
针对每个UPDATE操作,生成相反的Update Log插入Undo Log。
Undo Log生成举例
Undo Log中基于回滚指针(DB_ROLL_PT)维护数据行的所有历史版本。初始数据行
事务Transaction1更新数据
此时Undo Log记录旧版本的数据值,且由于是第一个版本,DB_TRX_ID和DB_ROLL_PT为NULL。
用排他锁锁定该行。
记录redo log。
把该行修改前的值Copy到undo log。
修改当前行的值,填写事务编号,使回滚指针指向undo log中的修改前的行。
事务Transaction2更新数据
Undo Log实现
Undo Log格式
InnoDB中,undo log分为:Insert Undo Log
Update Undo LogInsert Undo Log
Insert Undo Log是INSERT操作产生的undo log。
INSERT操作的记录由于是该数据的第一个记录,对其他事务不可见,该Undo Log可以在事务提交后直接删除。
type_cmpl:undo的类型
undo_no:事务的ID
table_id:undo log对应的表对象
接着的部分记录了所有主键的列和值。Update Undo Log
Update Undo Log记录对DELETE和UPDATE操作产生的Undo Log。
Update Undo Log会提供MVCC机制,因此不能在事务提交时就删除,而是放入undo log链表,等待purge线程进行最后的删除。
update_vector表示update操作导致发生改变的列,每个修改的列信息都要记录。对于不同的undo log类型,可能还需要记录对索引列所做的修改。
Undo Log存储管理
InnoDB基于Rollback Segment管理Undo Log,每个Rollback Segment记录1024个Undo Segment,Rollback Segment默认存储在共享表空间中。
Rollback Segment管理参数:
- innod_undo_directory:设置Rollback Segment文件所在的路径,默认在共享表空间内。
- innodb_undo_logs:设置Rollback Segment的个数,默认为128,即innoDB默认支持同事在线的事务限制为128 * 1024。
- innodb_undo_tablespaces:构成Rollback Segment的文件数量。
当事务没有提交时,InnoDB必须保留该事务对应的Undo Log。但是当事务提交时,依然不能删除Undo Log,因为要支持MVCC,可能有其他处于Repeatable Read隔离级别下的事务,正在读取对应版本的数据。
事务提交时,虽然不会立即删除Undo Log,但是会将对应的Undo Log放入一个删除列表中,未来通过purge线程来进行判断并删除。