概念
Multi-Version Concurrency Control :多版本并发控制
优势:
允许多个版本同时存在,并发执行。
不依赖锁机制,性能高。
只在RC与RR级别下工作(其他隔离级别没有意义)。
只有在InnoDB下支持。
实现原理
- 隐藏列
InnoDB存储引擎中,它的聚簇索引记录中都包含两个必要的隐藏列(row_id并不是必要的,我们创建的表中有主键或者非NULL的UNIQUE键时都不会包含row_id列):
trx_id:每次一个事务对某条聚簇索引记录进行改动时,都会把该事务的事务id赋值给trx_id隐藏列。
roll_pointer:每次对某条聚簇索引记录进行改动时,都会把旧的版本写入到undo日志中,然后这个隐藏列就相当于一个指针,可以通过它来找到该记录修改前的信息。
当MVCC数据库需要对一条记录操作的时候,它不会直接在老的数据上行直接修改,而是创建新的数据行,包含上述两个字段,这样储存多个版本的数据,就有效的防止了并发读写的问题。
2.事务链
每次对记录进行改动,都会记录一条undo日志,每条undo日志也都有一个roll_pointer属性(INSERT操作对应的undo日志没有该属性,因为该记录并没有更早的版本),可以将这些undo日志都连起来,串成一个链表。
ReadView
对于RU级别的事务,每次都可以读取到未提交的修改记录,而SERIALIZABLE级别下通过加锁来访问记录。而在RC与RR级别下都要读取到已经提交的记录,也就是说假如另一个事务已经修改了记录但是尚未提交,是不能直接读取最新版本的记录的,核心问题就是:需要判断一下版本链中的哪个版本是当前事务可见的。为此,设计InnoDB的大叔提出了一个ReadView的概念,这个ReadView中主要包含4个比较重要的内容:
m_ids:表示在生成ReadView时当前系统中活跃的读写事务的事务id列表。
min_trx_id:表示在生成ReadView时当前系统中活跃的读写事务中最小的事务id,也就是m_ids中的最小值。
max_trx_id:表示生成ReadView时系统中应该分配给下一个事务的id值。
对于RC与RR他们的区别是:
RC级别下可以读取别的事务提交后的修改,而RR级别读取不到。
之所以有这个差别是因为:他们生成ReadView的时机不同:
在RC下:每个select都会创建一个ReadView,也就是说每个select语句都会读取目前已经提交的新数据。
在RR下:当事务的第一个select语句后创建一个ReadView,之后读取的都是这个ReadView。
快照读与当前读
在RR级别下快照读(snapshot read)是通过MVCC与undo log实现的,它能防止不可重复读问题,缺不能杜绝幻读。
当前读(current read)通过record lock与gap lock实现,可以杜绝幻读问题。