作者徐轶韬
MySQL与其它的数据库一样,需要一个储存元数据的地方。在MySQL8之前,它们以各种文件的形式保存在不同的地方,例如 .FRM , .TRG ,.TRN等等。随着时间的推移,这些文件逐渐成为了各种环境中的瓶颈。MySQL8推出了支持事务的数据字典。
MySQL8.0的数据字典,相比较之前的版本,具有如下优势:
- 改善INFORMATION_SCHEMA性能:
MySQL的INFORMATION_SCHEMA由于性能问题,被用户抱怨了很长一段时间,其原因是因为磁盘访问会带来额外的IO开销。而在MySQL8.0里,INFORMATION_SCHEMA的一部分表是通过建立数据字典表之上的视图来实现的,服务器无需为每次查询INFORMATION_SCHEMA创建临时表。之前读取INFORMATION_SCHEMA的信息需要执行文件操作,而现在只需要进行数据库里面的检索即可。
- 集中统一管理元数据:
8.0之前的MySQL,服务器和Inndb的数据字典会分别保存在不同的地方,里面会有一些重复的数据,这些数据可能好长一段时间不会进行同步。另外对于类似MyISAM表的FRM, .PAR, .OPT, .TRN等不同文件进行管理时,需要使用复杂的代码控制主从复制、崩溃故障恢复状态。并且缺乏可扩展性。现在将这些元数据文件存储在数据字典表中。
- 具有原子性DDL的数据字典:
MySQL8.0支持原子性DDL语句,DDL语句被并入数据字典的更新、存储引擎操作,并且会产生一个相关的二进制日志,因此可以确保一个具有原子性的完整事务执行。
- 事务、崩溃安全的数据字典:
数据字典保存在具有完整事务功能的InnoDB表中,并保存在mysql系统数据库下面。数据字典创建在一个InnoDB表空间文件mysql.ibd里,该文件必须保存在MySQL的数据文件夹下面,不能修改其名称,也不能被其它表空间文件使用。
- 数据字典对象缓存:
为了节省磁盘IO,数据字典对象缓存会将之前访问过的数据字典对象进行缓存以便重复利用。与MySQL的其它缓存机制一样,采用LRU策略。
- 数据字典升级:
新版本的MySQL可能包含更改的数据字典表定义,当MySQL执行原地升级时,这些更改在服务器重启时执行。在服务器启动时,服务器会对数据字典的当前版本与存储在数据字典里的信息进行比较,以决定是否升级。如果需要并支持升级,服务器将创建一个新的数据字典表,并将元数据复制到新表中,自动替换旧的数据字典表。如果无需升级,服务器将会正常启动。可以使用 mysqld --no-dd-upgrade阻止自动升级,当服务器监测到数据字典版本信息与保存的不一致时,启动失败并提示错误信息。
最后,介绍一下关于MySQL8.0数据字典在使用上的一些注意事项。
- 之前的版本当开启innodb_read_only时,仅对InnoDB引擎有效,现在适用于全部的存储引擎,阻止表的创建和删除操作。原因在于创建和删除操作将会修改数据字典表,这些表使用的是InnoDB引擎。
- 之前mysql系统数据库里面的表是对DDL和DML可见的,MySQL8.0的数据字典表是不可见的,无法直接对其进行查询和修改,但是可以通过查询INFORMATION_SCHEMA来替代。
- 表的统计信息保存在 STATISTICS 和 TABLE 表里面,为了提高INFORMATION_SCHEMA的性能,这两个表里面的内容被放入了缓存中,放入缓存中的数据时限可以通过系统变量information_schema_stats_expiry来设置。与之前直接查询获得当前统计信息不同,现在需要执行ANALYZE TABLE来获取最新统计信息,或者将information_schema_stats_expiry设置为0。
- mysqldump 和 mysqlpump 不再对INFORMATION_SCHEMA库执行操作,即使是显示指定该库也不可以。之前可以将mysql系统库的全部表进行转储,现在只能对非数据字典表执行转储。另外,如需将event和proc表进行转储,需要显示指定 --routines 和 --events选项。MySQL8.0转储proc表和event表时,将无法对时间戳进行操作。
- CREATE TABLE dst_tbl LIKE src_tbl 语句如果源表是基于数据字典表的INFORMATION_SCHEMA视图,执行将会报错。