mysql innodb的表由.frm .ibd 组成,frm:存了每个表的元数据,包括表结构的定义等;ibd:存了每个表的元数据,包括表结构的定义等;

1.0 ibd文件基本结构

ibd文件由Tablespaces,Segments,Extents,Pages组成。

Tablespaces(FIL_PAGE_TYPE_FSP_HDR):是数据文件的第一个Page,存储表空间关键元数据信息。

Segments(FIL_PAGE_INODE):数据文件的第3个page,用于管理数据文件中的segement,每个索引占用2个segment,分别用于管理叶子节点和非叶子节点。

Extents(FIL_PAGE_TYPE_XDES):XDES Page除了文件头部外,其他都和FSP_HDR页具有相同的数据结构,可以称之为Extent描述页,每个Extent占用40个字节,一个XDES Page最多描述256个Extent。

Pages(FIL_PAGE_INDEX):是InnoDB管理存储空间的基本单位,一个页的大小一般是16KB。

mysql里如何解开idb文件 mysql idb文件_mysql里如何解开idb文件


新建一个数据库时,innodb存储引擎会初始化一个名为ibdata1 的表空间文件,这个文件会存储所有表的数据,以及我们所熟知但看不到的系统表sys_tables、sys_columns、sys_indexes 、sys_fields等。此外,还会存储用来保证数据完整性的回滚段数据;通过设置参数innodb_file_per_table,可以每一个表都对应一个自己的独立表空间文件,而不是存储到公共的ibdata1文件中。独立的表空间文件之存储对应表的B+树数据、索引和插入缓冲等信息,其余信息还是存储在默认表空间中。

1.1 PAGE类型是FIL_PAGE_TYPE_FSP_HDR的文件结构

是ibd的第一个page,记录整个表的Page管理信息,主要包含2种数据结构,分别为fsp header和xdes entry。
1.fsp header固定为112字节(是这个page的核心职责)
2.fsp header之后为xdes entry数组(256),每个entry管理64个page,1个page16K(即管理256M空间),该数组在FIL_PAGE_TYPE_XDES中介绍

1.1.1 基本结构介绍

mysql里如何解开idb文件 mysql idb文件_主键_02

1.1.2 表头介绍

mysql里如何解开idb文件 mysql idb文件_mysql里如何解开idb文件_03

  • space id 当前表空间的ID
  • size 当前space最大可容纳的page数,文件扩大时才会改变这个值
  • limit 当前space已经分配初始化的page数,包括空闲的和已经使用的
  • flag 未起作用
  • frage used FSP_FREE_FRAG列表中已经被使用的page数
  • free list space中可用的extent对象列表,extent里面没有一个page被使用
  • frag free list 有可用碎叶page的extent列表,exntent里面有部分page被使用
  • frag full list 没有有可用page的extent列表,exntent里面全部page被使用
  • segment id 下一个可利用的segment id
  • full inode list space当前完全占满的segment inode页列表
  • free inode list space当前完全占满的segment inode页列表,full inode list 和 free inode list的结构如下

mysql里如何解开idb文件 mysql idb文件_数据库_04

1.2 PAGE类型是FIL_PAGE_INODE的文件结构

段是表空间文件中的主要组织结构,它是一个逻辑概念,用来管理物理文件,是构成索引、表、回滚段的基本元素。创建一个索引(B+树)时会同时创建两个段,分别是内节点段和叶子段,内节点段用来管理(存储)B+树非叶子(页面)的数据,叶子段用来管理(存储)B+树叶子节点的数据;也就是说,在索引数据量一直增长的过程中,所有新的存储空间的申请,都是从“段”这个概念中申请的。

mysql里如何解开idb文件 mysql idb文件_mysql_05


每个INODE ENTRY管理一个段(如索引段(即B+树的内部节点)下的所有extend(簇),数据段(B+树的叶子节点),回滚段等等),这个段下的所有页由extend(簇)来管理

mysql里如何解开idb文件 mysql idb文件_主键_06


inode entry字段解释

mysql里如何解开idb文件 mysql idb文件_mysql_07

1.3 PAGE类型是FIL_PAGE_TYPE_XDES的文件结构

数据文件的第一个Page类型为FIL_PAGE_TYPE_FSP_HDR,在创建一个新的表空间时进行初始化(fsp_header_init),该page同时用于跟踪随后的256个Extent(约256MB文件大小)的空间管理,所以每隔256MB就要创建一个类似的数据页,类型为FIL_PAGE_TYPE_XDES ,XDES Page除了文件头部外,其他都和FSP_HDR页具有相同的数据结构,可以称之为Extent描述页,每个Extent占用40个字节,一个XDES Page最多描述256个Extent。

mysql里如何解开idb文件 mysql idb文件_mysql里如何解开idb文件_08

  • file segment id:段id,如果extent属于某个段的话,记录其段id,占用8个字节
  • xdes list node:extent链表的双向指针节点,占用12个字节,fsp header中的链表头指向的目标就是这里
  • state:该extent的状态,比如空闲或者已完全被使用等等,该状态是枚举类型,值为XDES_FREE,XDES_FREE_FRAG,XDES_FULL_FRAG,XDES_FSEG,占用4字节
  • page state bitmap: 用2个bit表示extent中的一个page,其中一个bit表示该page是否是空闲(XDES_FREE_BIT),另一个bit保留,尚未使用(XDES_CLEAN_BIT),占用16字节,16*8/2=64,正好可以标记一个extent 64个页的使用情况

1.4 PAGE类型是FIL_PAGE_INDEX的文件结构

是ibd的用于管理页节点和叶子节点的page。

mysql里如何解开idb文件 mysql idb文件_数据库_09


User Records记录具体的数据内容,其中就包括数据库每行数据的具体数据,单条记录文件结构如下

mysql里如何解开idb文件 mysql idb文件_mysql里如何解开idb文件_10

如果是聚簇索引

索引结构:[主键列][TRXID][ROLLPTR][其他建表的非主键列]
参与记录比较的列:主键列
内节点key列:[主键列]+page No指针

如果是二级索引

索引结构:[索引列][主键列]
参与记录比较的列:[索引列][主键列]
内节点key列:[索引列][主键列]+page No指针

2.0 通过py_innodb_page_info查看ibd的基本信息,如下:

没有找到趁手的二进制分析工具分析idb文件,如果谁找到好的工具还望告知哈!我现在用的是Analysis这个工具

page offset 00000000, page type <File Space Header>   //page类型FIL_PAGE_TYPE_FSP_HDR
page offset 00000001, page type <Insert Buffer Bitmap>
page offset 00000002, page type <File Segment inode>   //page类型FIL_PAGE_INODE
page offset 00000003, page type <B-tree Node>, page level <0002>   //page类型FIL_PAGE_INDEX,Page Header->PAGE_LEVEL=2,是叶节点
page offset 00000004, page type <B-tree Node>, page level <0002>
page offset 00000005, page type <B-tree Node>, page level <0002>
page offset 00000006, page type <B-tree Node>, page level <0001>   //page类型FIL_PAGE_INDEX,Page Header->PAGE_LEVEL=1,是叶节点
page offset 00000007, page type <B-tree Node>, page level <0001>
page offset 00000008, page type <B-tree Node>, page level <0002>
page offset 00000009, page type <B-tree Node>, page level <0002>
page offset 0000000a, page type <B-tree Node>, page level <0000>   //page类型FIL_PAGE_INDEX,Page Header->PAGE_LEVEL=0,是叶子节点
page offset 0000000b, page type <B-tree Node>, page level <0000>
page offset 0000000c, page type <B-tree Node>, page level <0000>
page offset 0000000d, page type <B-tree Node>, page level <0000>
page offset 0000000e, page type <B-tree Node>, page level <0000>
page offset 0000000f, page type <B-tree Node>, page level <0000>
...
page offset 00000000, page type <Freshly Allocated Page>
page offset 00000000, page type <Freshly Allocated Page>
page offset 00000000, page type <Freshly Allocated Page>
page offset 00000000, page type <Freshly Allocated Page>
Total number of page: 14592:
Freshly Allocated Page: 2584
Insert Buffer Bitmap: 1
File Space Header: 1
B-tree Node: 12005
File Segment inode: 1

3.0 分析文件结构,对我们优化数据库的帮助

1.我们知道mysql的其中一个重要的性能瓶颈就是磁盘IO。如果一张表的字段越多,字段的值越大,意味着一个Page能存放的数据量越少,造成数据查询需要加载更多的Page进行更多的IO操作。
2.我们知道磁盘的顺序读写要比随机读写快,但是频繁的插入和删除后,逻辑上相邻的数据可能分散在不同的Page中(数据是以链表形式存放在Page中的)。所以有的时候删除重建索引可以提高查询效率,即:将逻辑上相邻的数据顺序存储在Page上,将随机读写变成顺序读写同时也减少了IO操作。
3.如果我们通过主键id查询某行数据,由于mysql数据本身就是索引,所以只需要执行一次IO;如果我们通过非主键索引查询一个某行数据的某个字段,如果该字段也属于该索引只执行一次IO即可,如果是非索引字段第一次IO取到主键id,第二次IO才是获取数据(这里说的可能有点片面)

4.0 参考借鉴:

MySQL InnoDB ibd 文件格式解析(fsp header & xdes entry)