前言

在MySQL中,DDL是不属于事务范畴的,如果事务和DDL并行执行,操作相关联的表的话,会出现各种意想不到问题,如​​事务特性被破坏​​​、​​binlog顺序错乱​​​等,为了解决类似这些问题,MySQL在5.5.3引入了MDL锁(Metadata Locking),关于其设计思路可以参考这两个worklog:​​WL#3726​​​ 和 ​​WL#4284​​。本篇从代码实现角度对MDL进行分析。

重要数据结构

MDL 是在 MySQL server 层实现的一个模块,通过对外接口和server层其它模块进行交互,在sql/mdl.h和sql/mdl.cc中实现。


  1. enum_mdl_type,枚举类型,表示MDL锁的类型,目前一共9种
  2.  * MDL_INTENTION_EXCLUSIVE           IX         // 意向X锁,只用于scope 锁
  3.  * MDL_SHARED                        S          // 只能读metadata,当能读写数据,如检查表是否存在时用这个锁
  4.  * MDL_SHARED_HIGH_PRIO              SH         // 高优先级S锁,可以抢占X锁,只能读metadata,不能读写数据,用于填充INFORMATION_SCHEMA,或者show create table时
  5.  * MDL_SHARED_READ                   SR         // 可以读表数据,select语句,lock table xxx read 都用这个
  6.  * MDL_SHARED_WRITE                  SW         // 可以更新表数据,insert,update,delete,lock table xxx write, select for update,
  7.  * MDL_SHARED_UPGRADABLE             SU         // 可升级锁,可以升级为SNW或者X锁,ALTER TABLE第一阶段会用到
  8.  * MDL_SHARED_NO_WRITE               SNW        // 可升级锁,其它线程能读metadata,数据可读不能读,持锁者可以读写,可以升级成X锁,ALTER TABLE的第一阶段
  9.  * MDL_SHARED_NO_READ_WRITE          SNRW       // 可升级锁,其它线程能读metadata,数据不能读写,持锁者可以读写,可以升级成X锁,LOCK TABLES xxx WRITE
  10.  * MDL_EXCLUSIVE                     X          // 排它锁,禁止其它线程的所有请求,CREATE/DROP/RENAME TABLE
  11. enum_mdl_duration,枚举类型,表示持有MDL锁的时间
  12.  * MDL_STATEMENT         // 语句范围的,语句结束自动释放
  13.  * MDL_TRANSACTION       // 事务范围的,事务结束时自动释放
  14.  * MDL_EXPLICIT          // 显式锁,由lock tables xxx read 这种获取,需要通过unlock tables释放
  15. MDL_key, 对MDL锁的一个标识,是个三元组:namespace + db_name + table_name
  16.  * m_ptr                  // 字符串数组,三元组就存在这里
  17.  - enum_mdl_namespace     // 内部定义的一个枚举类型,表示加锁对象的类型
  18.      * GLOBAL             // 全局读锁,FLUSH TABLES WITH READ LOCK
  19.      * SCHEMA             // 数据库锁
  20.      * TABLE              // 表锁
  21.      * FUNCTION           // 函数锁
  22.      * PROCEDURE          // 存储过程
  23.      * TRIGGER            // 触发器
  24.      * EVENT              // event事件
  25.      * COMMIT             // 全局commit锁,FLUSH TABLES WITH READ LOCK
  26. MDL_request, 线程的锁请求,这个会发送给MDL子系统,包含加锁对象(MDL_key)、加什么类型锁(enum_mdl_type)、锁持有时间(enum_mdl_duration)等信息
  27.  * type                    // 类型是enum_mdl_type,表示锁请求的类型
  28.  * duration                // 类型是enum_mdl_duration,表示锁的持有时间
  29.  * next_in_list            // 当前线程中下一个MDL_request指针,和prev_in_list一起所有MDL_request串起来,形成双向链表
  30.  * prev_in_list            // 见上
  31.  * ticket                  // 加锁成功后,MDL模块会返回一个ticket
  32.  * key                     // MDL_key
  33. MDL_ticket, MDL子系统内部对加锁请求或已获得锁的表示,对MDL来说非常重要,同时是MDL_wait_for_subgraph的子类,线程的锁等待图就通过ticket构建出来。
  34.  * next_in_context          // 和prev_in_context一起构造在当前context下所有的ticket双向链表
  35.  * prev_in_context          // 见上
  36.  * next_in_lock             // 和prev_in_lock一起构造当前MDL_lock的等待和持有ticket双向链表
  37.  * prev_in_lock             // 见上
  38.  - has_pending_conflicting_lock  // 当前ticket的锁类型是否和对应MDL锁的等待队列中的锁冲突
  39.  - is_upgradable_or_exclusive    // 是否是可以升级或者互斥锁
  40.  - has_stronger_or_equal_type    // 当前ticket对应的锁和指定的锁比较是否更强(如X比S强)
  41.  - is_incompatible_when_granted  // 是否能加锁
  42.  - is_incompatible_when_waiting  // 是否比等待队列中的tciket类型优先级更高
  43.  - accept_visitor                // 死锁检测用到
  44.  - get_deadlock_weight           // 拿一个死锁权重,死锁检测用
  45.  * m_type                        // 锁类型
  46.  * m_duration                    // 持有时间,debug 模式下有效
  47.  * m_ctx                         // 指向所属context
  48.  * m_lock                        // 指向请求的锁对象
  49. MDL_wait,锁等待实现,当拿不到锁时就要进入等待,等待的结果也存在这里面
  50.  - enum_wait_status       // 锁等待退出时的状态
  51.      * EMPTY              // 初始化值
  52.      * GRANTED            // 加锁成功,拿到锁
  53.      * VICTIM             // 等待的时候,死锁检测发现死锁,当前线程选为victim,加锁失败
  54.      * TIMEOUT            // 加锁超时,加锁失败
  55.      * KILLED             // 连接被kill,加锁失败
  56.  - timed_wait             // 等待的实现,条件变量+超时
  57. MDL_context,在MDL子系统中,对应一个线程,thd和MDL系统交互就通过这个类实现
  58.  - try_acquire_lock                       // 尝试加锁,加锁失败就返回,没有死锁检测
  59.  - acquire_lock                           // 加一个锁,和上面的区别是多了死锁检测
  60.  - acquire_locks                          // 一次性加多个排它锁,要么成功,要么全失败
  61.  - upgrade_shared_lock                    // 升级共享锁
  62.  - clone_ticket                           // clone 出一个 ticket
  63.  - release_all_locks_for_name             // 把当前线程对某个对象加的所有MDL锁都释放掉
  64.  - release_lock                           // 释放单个锁
  65.  - is_lock_owner                          // 是否持有某个对象的锁
  66.  - has_lock                               // 线程是否否在savepoint之前持有指定的锁
  67.  - has_locks                              // 当前线程是否持有锁
  68.  - set_explicit_duration_for_all_locks    // 锁的时间范围都置为显式
  69.  - set_transaction_duration_for_all_locks // 锁的时间范围都置为事务
  70.  - set_lock_duration                      // 设置锁的时间范围
  71.  - release_statement_locks                // 释放所有语句时间范围的锁
  72.  - release_transactional_locks            // 释放所有事务时间范围的锁
  73.  - rollback_to_savepoint                  // MDL 锁回滚到某个savepoint
  74.  - get_deadlock_weight                    // 死锁时拿一个权重值,以此来判断对应线程是否要做为victim
  75.  * m_wait                                 // 锁等待
  76.  * m_tickets                              // 指针数组,每个元素指向一个ticket链表,分别对应当前线程的语句范围锁、事务范围锁和显式锁
  77.  * m_owner                                // 指向thd的指针
  78.  * m_waiting_for                          // 当前线程正在等待的锁
  79.  - find_ticket                            // 在当前线程ticket链表中查找一个ticket
  80.  - release_locks_stored_before            // 释放ticket链表上在某个ticket之前所有ticket
  81.  - find_deadlock                          // 检测是否有死锁
  82.  - visit_subgraph                         // 和死锁检测相关
  83. MDL_map,MDL_key 到 MDL_lock 的一个映射,MDL模块内部用,MDL系统所有锁都放在这个Map里
  84.  - init                       // 初始化
  85.  - destroy
  86.  - find_or_insert             // 查找对应的MDL_lock,没有的话新建并插入
  87.  - remove                     // 移除MDL_lock
  88.  * m_partitions               // MDL_map 分区
  89.  * m_global_lock              // 预先分配的全局读锁
  90.  * m_commit_lock              // 预先分配的全局commit锁
  91. MDL_map_partition,为了提升MDL模块的扩展性,把原本的一个MDL_map分成多个分区,每个分区就是一个 MDL_map_partition
  92.  - find_or_insert                   // 当前分区中查找对应的MDL_lock,没有的话新建并插入
  93.  - remove                           // 在当前分区中移除MDL_lock
  94.  - move_from_hash_to_lock_mutex     // 锁转换,释放对分区的加锁(MDL_map_partition::m_mutex),获取lock对象的锁(MDL_lock::m_rwlock)
  95.  * m_mutex                          // 对分区对象的一个保护锁,修改当前分区要拿到这个锁
  96.  * m_unused_locks_cache             // 释放掉的锁对象的一个缓存,不用再新分配内存
  97. MDL_lock,MDL锁对象,对于一个key组合(三元组),整个系统只有一个锁对象,不管请求的key是什么类型,什么时间范围
  98. - Ticket_list                      // 一个内部嵌套类,用于表示当前MDL锁相关的ticket列表,是个list
  99.     - add_ticket                   // 增加 ticket
  100.     - remove_ticket                // 移除 ticket
  101.     - is_empty                     // list 是不是空的
  102.     - clear_bit_if_not_in_list     // 如果当前list中没有某种类型的ticket,就把对应的位清掉
  103.     * m_list                       // 存放ticket的list
  104.     * m_bitmap                     // 标识当前list中所有ticket类型对应bit位的bitmap,实例是个short类型
  105. * key                              // 当前锁对应的MDL_key
  106. * m_rwlock                         // 对MDL_lock锁对象的保护锁
  107. - has_pending_conflicting_lock     // 已经授权的ticket是否和等待队列中的ticket不兼容
  108. - can_grant_lock                   // 能否加锁,先和等待队列进行优先级比较,然后看和已授权的锁是否兼容
  109. - reschedule_waiters               // 当持有当前锁的ticket释放或者降级时,会调用下,看等待队列里是否有ticket此时可以获取锁
  110. - remove_ticket                    // 从指定队列中移出ticket
  111. - visit_subgraph                   // 死锁检测相关
  112. - needs_notification               // 是否需要通知其它线程,当前ticket的锁情况
  113. - notify_conflicting_locks         // 通知其它线程,有一个高级的锁请求
  114. - hog_lock_types_bitmap            // 标识哪种锁是高级锁
  115. * m_granted                        // 已经获得当前MDL锁的ticket队列
  116. * m_waiting                        // 等待当前MDL锁的ticket队列
  117. * m_hog_lock_count                 // 高级锁可以连接拿得锁的个数,超过这个数目就要给低级锁让路,防止低级锁饿死
  118. * m_ref_usage                      // 和下面2个变量一起,为了提高锁的扩展性
  119. * m_ref_release
  120. * m_is_destroyed
  121. * m_version                        // 用于判断锁对象是否被放入unsed队列
  122. * m_map_part                       // 当前MDL锁所在的MDL_map 分区
  123. MDL_scoped_lock,MDL_lock的一个子类,主要用于对schema加MDL锁,全局读锁和全局commit锁也是这种类型。
  124. MDL_object_lock,MDL_lock的另一个子类,除了MDL_scoped_lock外,其它都用这个(table、fucntion等),只有 MDL_object_lock 可以缓存。

总结下,上面这些类中,MDL_key 和 MDL_request 都是POD,用来保存信息的;MDL_context是MDL子系统和线程交互的接口,一个对象对应一个线程;MDL_map、MDL_map_partition 和 MDL_lock 都是MDL子系统内部实现细节,对server层其它部分不可见;MDL_ticket 表示线程对MDL_lock持有的某种锁。

MDL锁可以从不同角度进行分类:


  1. namespace,如GLOBAL、SCHEMA、TABLE等;
  2. 锁的持续时间,如transaction、显式等;
  3. 锁的兼容性,如S、X、SH等;
  4. 锁的实现类,如scope,object等;

可以看作是MDL锁的不同属性,大家不要搞乱了 :-)

模块初始化

整个MDL模块的初始化是在mysqld启动时进行的,初始化逻辑在 MDL_map::init() 中,做的事情也比较简单:


  1. 初始化两个全局MDL锁,global lock 和 commit lock,两者都是类型都是MDL_scoped_lock;
  2. 分配metadata_locks_hash_instances个map分区,为了解决MDL模块​​全局锁竞争问题​​​,在5.6.8对MDL锁做了分区(​​commit​​),通过metadata_locks_hash_instances配置指定用多少个分区,默认是8个。

加锁

加锁就是server的线程(thd)向MDL模块获取对应锁的ticket过程,加锁成功标志是MDL模块返回一个对应的ticket,大致逻辑如下:


  1. 线程解析SQL语句,根据语义对每一个表对象设置TABLE_LIST.mdl_request,如对普通的select语句 TABLE_lsit.mdl_request.type 就是MDL_SHARED_READ,可以参考函数st_select_lex::set_lock_for_tables();
  2. 线程在打开每个表之前,会请求和这个表对应的MDL锁,通过 thd->mdl_context.acquire_lock() 等接口将mdl_request请求发给MDL模块;
  3. MDL模块根据请求类型和已有的锁来判断请求能否满足,如果可以就返回一个ticket;如果不可以就等待,等待结果可以是成功(别的线程释放了阻塞的MDL锁)或者失败(超时、连接被kill或者被死锁检测选为victim);
  4. 线程根据MDL模块的返回结果,决定继续往下走还是报错退出。

需要注意的是,MDL锁并不是对表加锁,而是在加表锁前的一个预检查,如果能拿到MDL锁,下一步加相应的表锁。

下面对MDL模块中的主要加锁方法进行介绍。

MDL_context::find_ticket​ 这是一个shortcut方法,加锁的时候先检查当前线程是否已持有对应key的MDL锁,并且这个锁的类型不比请求的低,那么就不需要经过MDL系统再分配一个ticket出来(这个比较复杂,代价较高),直接使用已有的ticket,或者clone一个。

举个例子:

1. begin;

2. insert into t1 values (1);

3. insert into t1 values (2);

   ...

在上面的语句序列中,执行语句3的时候就不需要再走一遍复杂的加锁逻辑,因为语句2已经成功拿到t1表的ticket,类型都是MDL_SHARED_WRITE,并且MDL锁时间范围也一样(transaction),这个时候直接用已有的ticket,甚至不用clone。

MDL_context::clone_ticket​ 经过检测发现可以直接使用已有的ticket,比如上面的MDL_context::find_ticket发现了可以复用的ticket,但是锁时间范围不一致,为了确保已经有锁释放时,不影响现在请求的,就clone一个ticket。

1. begin;

2. insert into t1 values (1);

3. handler t1 open;

   ...

在上面的语句序列中,执行语句3的时候,发现有可以复用的ticket(语句2的ticket),但是handler需要的MDL锁是显式的,而语句2取得的ticket是事务时间范围的,事务完成后就会释放,为了避免handler的MDL锁被提前释放,因此单独clone一个出来用。

MDL_context::try_acquire_lock_impl​ 无等待的加锁,如果发现有冲突导致加锁失败,直接退出。会先调用MDL_context::find_ticket看是否有可以复用的ticket,有的话就返回成功,如果没有就看能否加锁,能加的话也返回成功,不能加也直接返回(同时返回一个ticket给调用者)。

MDL_context::acquire_lock​ 主加锁函数,调试MDL锁相关问题时,给这个函数加断点比较有效。先调用MDL_context::try_acquire_lock_impl,如果加锁失败就进入等待加锁逻辑:


  1. 将MDL_context::try_acquire_lock_impl返回的ticket放进MDL_lock的等待队列;
  2. 触发一次死锁检测(后面会详细介绍);
  3. 进入等待,这个时候如果我们show processlist就会看到”Waiting for table metadata lock”之类state。等待又分为2种:

  • 定时检查等待: 如果当前请求的锁是比较高级的(对于MDL_object_lock是比MDL_SHARED_NO_WRITE类型更高,对于MDL_scoped_lock是MDL_SHARED类型),就会每秒给其它持有当前锁的线程(并且这些连接持有的锁等级比较低)发信号,通知其释放锁,然后再检查是否锁已拿到;
  • 一直等待,直到超时;

  1. 检查步骤3的等待结果,可以是GRANTED(拿到锁)、VICTIM(被死锁检测算法选为受害者)、TIMEOUT(加锁超时)、KILLED(连接被kill)。拿到锁返回成功,其它返回失败。

锁等待是靠MDL_wait这个类来实现的。

MDL_context::acquire_locks​ 一次性加多个排它MDL锁,如果其中一个加锁失败,前面已经拿到的锁也全部释放。主要用在DDL中,比如drop table test.t1这个DDL会一次加3个锁:


  • GLOBAL,MDL_INTENTION_EXCLUSIVE
  • test 库, MDL_INTENTION_EXCLUSIVE
  • test.t1 表,MDL_EXCLUSIVE

MDL_context::upgrade_shared_lock​ 锁升级,从共享锁升级到互斥锁,实现方式是重新申请一个目标锁,拿到新的ticket后替换老的ticket,用在alter table和create table场景中。

如create table test.t1(id int) engine = innodb,会先拿test.t1的MDL_SHARED共享锁,检查表是否存在,如果不存在就把锁升级到MDL_EXCLUSIVE锁,然后开始建表。

对于alter table test.t1 add column name varchar(10), algorithm=copy;,alter用copy到临时的方式来做。整个过程中MDL顺序是这样的:


  1. 刚开始打开表的时候,用的是 MDL_SHARED_UPGRADABLE 锁;
  2. 拷贝到临时表过程中,需要升级到 MDL_SHARED_NO_WRITE 锁,这个时候其它连接可以读,不能更新;
  3. 拷贝完在交换表的时候,需要升级到是MDL_EXCLUSIVE,这个时候是禁止读写的。

所以在用copy算法alter表过程中,会有2次锁升级。

MDL_ticket::downgrade_lock​ 和MDL_context::upgrade_shared_lock对应的锁降级,从互斥锁降级到共享锁,实现比较简单,直接把锁类型改为目标类型(不用重新申请)。

对于alter table test.t1 add column name varchar(10), algorithm=inplace,如果alter使用inplace算法的话,整个过程中MDL加锁顺序是这样的:


  1. 和copy算法一样,刚开始打开表的时候,用的是 MDL_SHARED_UPGRADABLE 锁;
  2. 在prepare前,升级到MDL_EXCLUSIVE锁;
  3. 在prepare后,降级到MDL_SHARED_UPGRADABLE(其它线程可以读写)或者MDL_SHARED_NO_WRITE(其它线程只能读不能写),降级到哪种由表的引擎决定;
  4. 在alter结束后,commit前,升级到MDL_EXCLUSIVE锁,然后commit。

可以看到inplace有2次锁升级,1次降级,不过在alter最耗时的阶段是有可能降级到MDL_SHARED_UPGRADABLE的,对其它线程的影响小。

MDL_context::release_locks_stored_before​ 释放线程指定ticket链表上某个ticket之前的所有ticket,每个context有3个ticket链表(statement、transaction和explicit),分别对应当前线程持有的不同时间范围的MDL锁。而ticket在链表中的顺序和时间顺序是相反的,后插入的ticket放在链表开头,因此本函数的作用就是把某个时间点之后的ticket都释放掉,回滚MDL锁。有几个指释放MDL锁的函数都是基于此实现:


  1. MDL_context::rollback_to_savepoint,把存档点之后的所有MDL锁都释放掉;
  2. MDL_context::release_transactional_locks,释放所有transaction和statement时间范围的MDL锁;
  3. MDL_context::release_statement_locks(),释放所有statement时间范围的MDL锁。

死锁检测

MDL模块作为一个集中的资源,收到不同线程发来的锁请求,而有的锁是互斥的,不能同时满足,在这种情况下就会等待,如果线程在此之前已经拿到某些锁的话,就会形成持有-等待的状态;而又不可能要求所有线程按某一固定顺序请求锁,这样就会形成等待循环,也就是死锁,如下图所示:

Metadata Locking_链表

图1. 死锁

线程T1持有M1,然后请求M2,但M2被线程T2持有,并且和T1的请求类型互斥,同时T2请求M1,和T1拿到的锁互斥,形成死锁。

在介绍MDL的死锁检测之前,先介绍下MDL锁的兼容矩阵。每种类型的锁各有2个兼容矩阵,granted matrix 和 waiting matrix,前者表示锁的兼容性,后者表示锁的优先级(优先级就是和等待队列的锁相比,当前锁是否能够进行加锁尝试,当前锁优先级高则可以,低则需进等待队列)。

矩阵中 ‘+’ 表示兼容,’-‘ 表示不兼容,’0’ 表示不可能存在的场景。

MDL_scoped_lock,支持IX,S和X锁(关于锁的缩写可以看第一节)。


  1. granted matrix
  2.           | Type of active   |
  3.   Request |   scoped lock    |
  4.    type   | IS(*)  IX   S  X |
  5.  ---------+------------------+
  6.  IS       |  +      +   +  + |
  7.  IX       |  +      +   -  - |
  8.  S        |  +      -   +  - |
  9.  X        |  +      -   -  - |
  10. waiting matrix
  11.           |    Pending      |
  12.   Request |  scoped lock    |
  13.    type   | IS(*)  IX  S  X |
  14.  ---------+-----------------+
  15.  IS       |  +      +  +  + |
  16.  IX       |  +      +  -  - |
  17.  S        |  +      +  +  - |
  18.  X        |  +      +  +  + |

IS锁虽然列了出来,但是代码里并没有实现这个锁,因为IS和所有的锁类型都兼容(也可以理解为每次锁请求都默认会额外有一个IS锁)。

MDL_object_lock,支持S、SH、SR、SW、SU、SNW、SNRW 和 X锁。


  1. granted matrix
  2.   Request  |  Granted requests for lock       |
  3.    type    | S  SH  SR  SW  SU  SNW  SNRW  X  |
  4.  ----------+----------------------------------+
  5.  S         | +   +   +   +   +   +    +    -  |
  6.  SH        | +   +   +   +   +   +    +    -  |
  7.  SR        | +   +   +   +   +   +    -    -  |
  8.  SW        | +   +   +   +   +   -    -    -  |
  9.  SU        | +   +   +   +   -   -    -    -  |
  10.  SNW       | +   +   +   -   -   -    -    -  |
  11.  SNRW      | +   +   -   -   -   -    -    -  |
  12.  X         | -   -   -   -   -   -    -    -  |
  13.  SU -> X   | -   -   -   -   0   0    0    0  |
  14.  SNW -> X  | -   -   -   0   0   0    0    0  |
  15.  SNRW -> X | -   -   0   0   0   0    0    0  |

关于’0’的情况说明下,比如对于SU锁来说其和自身是不兼容的,不可能有2个线程对同一个对象都持有SU锁,所以就不存在当一个线程进行锁升级时,另一个线程持有SU。其它’0’的情况类似。


  1. waiting matrix
  2.   Request  |  Pending requests for lock      |
  3.    type    | S  SH  SR  SW  SU  SNW  SNRW  X |
  4.  ----------+---------------------------------+
  5.  S         | +   +   +   +   +   +     +   - |
  6.  SH        | +   +   +   +   +   +     +   + |
  7.  SR        | +   +   +   +   +   +     -   - |
  8.  SW        | +   +   +   +   +   -     -   - |
  9.  SU        | +   +   +   +   +   +     +   - |
  10.  SNW       | +   +   +   +   +   +     +   - |
  11.  SNRW      | +   +   +   +   +   +     +   - |
  12.  X         | +   +   +   +   +   +     +   + |
  13.  SU -> X   | +   +   +   +   +   +     +   + |
  14.  SNW -> X  | +   +   +   +   +   +     +   + |
  15.  SNRW -> X | +   +   +   +   +   +     +   + |

注意 SH 比 X 锁的优先级还高,正是其高优先级(high priority)的体现。

在MDL系统中,资源关系是这样的:


  1. 线程和锁的关系通过ticket建立;
  2. 每个线程有3个ticket链表,分别对应当前持有的statement锁、transaction锁和显式锁,放在 MDL_context::m_tickets中;对于当前线程正在等待的锁只有一个,用MDL_context::m_waiting_for表示;
  3. 每个MDL锁有2个ticket链表,分别对应已经获得锁的线程(MDL_lock::m_granted)和等待锁的线程(MDL_lock::m_waiting);
  4. 线程的ticket链表和MDL锁的ticket链表一起构成了MDL系统的等待关系图,死锁检测就是搜索这张图,看是否有环路。

为了描述的简洁,我们将线程和MDL锁的ticket链表都简化为1个,如下图2矩阵的,横线表示线程的链表,纵向表示MDL锁的链表,有色彩的交点表示一个ticket,橘黄色表示连接已经拿到锁,青色表示正在等待的锁,图中MDL上锁的类型不兼容,形成持有等待回路——死锁。

Metadata Locking_链表_02

图2. MDL死锁

下面介绍下死锁检测中的函数。

MDL_context::find_deadlock​ 这个是死锁检测的入口,线程在MDL_context::acquire_lock尝试拿锁失败,进入等待之前,会调用这个函数进行一次死锁检测。

函数会行循环检测,直到发现没有死锁(每轮检测会去掉等待图中一条边,但不保证能解决死锁,所以需要循环),或者当前线程被选为victim才退出。

MDL_context::visit_subgraph​ 看当前线程是否有锁等待MDL_context::m_waiting_for,有的话就沿着ticket搜下去,没有就退出。

MDL_ticket::accept_visitor​ 这个方法看起来没有什么实际内容,只是简单调用MDL_lock::visit_subgraph,其实可以看作是搜索视角的转换,从 MDL_context 经过 MDL_ticket 进入到 MDL_lock,代码逻辑显得比较清晰。

MDL_lock::visit_subgraph​ 这个是死锁检测核心逻辑:


  1. 先给搜索深度加1,然后判断是否超过最大搜索深度(MAX_SEARCH_DEPTH= 32),超过就无条件认为有死锁,退出;
  2. 遍历当前锁的ticket链表,看ticket对应的线程是否和死锁检测的发起线程是同一个,如果是则说明有回路,退出(相当于做了一层的广度搜索);
  3. 从头开始遍历当前锁的ticket链表,对每个ticket对应的线程,递归调用MDL_context::visit_subgraph(深度搜索)。

整个死锁检测逻辑是一个加了深度限制的深搜,中间同时多了一层广搜。

Deadlock_detection_visitor​ 是死锁检测中重要的辅助类,主要负责:


  1. 记录死锁检测的起始线程;MySQL · 特性分析 · MDL 实现分析
  2. 记录被选做victim的线程;
  3. 在检测到死锁,深搜一层层退出的时候,会依次检查回路上各线程的死锁权重,选择权重最小的做为最终的victim(权重由锁的类型决定)。

global read lock

相信FTWRL(FLUSH TABLES WITH READ LOCK)这个命令很多人都用过,比如备份时为了获取SQL线程执行位点或binlog位点,这个命令的目的是阻止新的更新进来和已有事务的提交。就这个命令主要靠MDL锁来实现,这里用到了2个MDL锁,namespace分别为MDL_key::GLOBAL和MDL_key::COMMIT,这2个锁在整个MDL系统中都是全局唯一的,都是MDL_scoped_lock类型。

执行 FTWRL 的线程会请求这2个锁的MDL_SHARED锁,并且是显式的。在所有更新数据的代码路径里,除了必须的锁外,还会额外请求MDL_key::GLOBAL锁的MDL_INTENTION_EXCLUSIVE锁;在事务提交前,会先请求MDL_key::COMMIT锁的MDL_INTENTION_EXCLUSIVE锁。对于scope锁来说,IX锁和S锁是不兼容的(参考granted matrix),所以更新和事务提交都被FTWRL挡到了。

Percona Server 实现的相对于 FTWRL 轻量级的backup锁也是基于MDL实现的,其对MDL_key的 namespace 额外扩展了2个,MDL_key::BACKUP和MDL_key::BINLOG,对应的2个锁也是全局唯一的,感兴趣的同学可以了解下​​backup locks​