1、MySQL执行计划的定义

在 MySQL 中可以通过 explain 关键字模拟优化器执行 SQL语句,从而知道 MySQL 是如何处理 SQL 语句的。

2、MySQL整个查询的过程

• 客户端向 MySQL 服务器发送一条查询请求
• 服务器首先检查查询缓存,如果命中缓存,则立刻返回存储在缓存中的结果。否则进入下一阶段
• 服务器进行 SQL 解析、预处理、再由优化器生成对应的执行计划
• MySQL 根据执行计划,调用存储引擎的 API 来执行查询
• 将结果返回给客户端,同时缓存查询结果
注意:只有在8.0之前才有查询缓存,8.0之后查询缓存被去掉了

3、如何启动执行计划

explain select 投影列 FROM 表名 WHERE 条件 ;

4、explain中的列

dbeaver mysql 执行计划 成本 mysql执行计划怎么生成的_数据库

4.1、id

查询执行顺序:
id 值相同时表示从上向下执行
id 值相同被视为一组
如果是子查询,id 值会递增,id 值越高,优先级越高
id为NULL最后执行。

4.2、select_type

● simple:表示查询中不包含子查询或者 union

EXPLAIN select * from actor where id=1;

dbeaver mysql 执行计划 成本 mysql执行计划怎么生成的_java_02


● primary:当查询中包含任何复杂的子部分,最外层的查询被标记成 primary

● derived:在 from 的列表中包含的子查询被标记成 derived

● subquery:在 select 或 where 列表中包含了子查询,则子查询被标记成 subquery

用个例子来了解primary、subquery和derived

set session optimizer_switch=‘derived_merge=off’;#关闭mysql5.7新特性对衍生表的合并优化

explain select (select 1 from actor where id = 1) from (select * from film where id = 1) der;

dbeaver mysql 执行计划 成本 mysql执行计划怎么生成的_java_03


set session optimizer_switch=‘derived_merge=on’; #还原默认配置

● union:两个 select 查询时前一个标记为 PRIMARY,后一个标记为 UNION。union 出现在 from 从句子查询中,外层 select 标记为 PIRMARY,union 中第一个查询为 DERIVED,第二个子查询标记为 UNION

explain select 1 union all select 1;

dbeaver mysql 执行计划 成本 mysql执行计划怎么生成的_MySQL_04


● unionresult:从 union 表获取结果的 select 被标记成 union result 。

4.3、table

显示这一行的数据是关于哪张表的。
当 from 子句中有子查询时,table列是 格式,表示当前查询依赖 id=N 的查询,于是先执行 id=N 的查询。
当有 union 时,UNION RESULT 的 table 列的值为<union1,2>,1和2表示参与 union 的 select 行id。

4.4、type

这是重要的列,显示连接使用了何种类型。
SQL 性能优化的目标:至少要达到 range 级别,要求是 ref 级别,如果可以是 consts 最好。
说明:
1) consts 单表中最多只有一个匹配行(主键或者唯一索引),在优化阶段即可读取到数据。
2) ref 指的是使用普通的索引(normal index)。
3) range 对索引进行范围检索。
反例:explain 表的结果,type=index,索引物理文件全扫描,速度非常慢,这个 index 级别比较 range
还低,与全表扫描是小巫见大巫。

从最好到最差的连接类型为 system > const > eq_reg > ref > range > index > ALL

一般来说,得保证查询达到range级别,最好达到ref

● NULL:mysql能够在优化阶段分解查询语句,在执行阶段用不着再访问表或索引。例如:在索引列中选取最小值,可以单独查找索引来完成,不需要在执行时访问表

explain select min(id) from film;

dbeaver mysql 执行计划 成本 mysql执行计划怎么生成的_mysql_05


● system:表中只有一行数据。属于 const 的特例。如果物理表中就一行数据为 ALL

● const :查询结果最多有一个匹配行。因为只有一行,所以可以被视为常量。const 查询速度非常快,因为只读一次。一般情况下把主键或唯一索引作为唯一条件的查询都是 const

explain select * from (select * from film where id = 1) tmp;

dbeaver mysql 执行计划 成本 mysql执行计划怎么生成的_子查询_06


● eq_ref:唯一性索引扫描,对于每个索引键,表中只有一条记录与之匹配。常见于主键或唯一索引扫描。

explain select * from film_actor left join film on film_actor.film_id = film.id

dbeaver mysql 执行计划 成本 mysql执行计划怎么生成的_MySQL_07


● ref:非唯一性索引扫描,返回匹配某个单独值得所有行。索引要和某个值相比较,可能会找到多个符合条件的行。1.简单 select 查询,name是普通索引(非唯一索引)

explain select * from film where name = ‘film1’;

dbeaver mysql 执行计划 成本 mysql执行计划怎么生成的_数据库_08


2.关联表查询,idx_film_actor_id是film_id和actor_id的联合索引,这里使用到了film_actor的左边前缀film_id部分

explain select film_id from film left join film_actor on film.id = film_actor.film_id;

dbeaver mysql 执行计划 成本 mysql执行计划怎么生成的_java_09


● range:把这个列当作条件只检索其中一个范围。常见 where 从句中出现 between、<、>、>=、in 等。主要应用在具有索引的列中

explain select * from actor where id > 1;

dbeaver mysql 执行计划 成本 mysql执行计划怎么生成的_数据库_10


● index:full index scan全索引扫描,index与all的区别为:index类型只遍历索引树,这通常比all快,因为索引文件通常比数据文件小。也就是说虽然index和all都是读全表,但index是从索引中读的,而all是从硬盘中读的。

explain select * from film;

dbeaver mysql 执行计划 成本 mysql执行计划怎么生成的_MySQL_11


● ALL:即全表扫描,扫描你的聚簇索引的所有叶子节点。通常情况下这需要增加索引来进行优化了。

explain select * from actor;

dbeaver mysql 执行计划 成本 mysql执行计划怎么生成的_mysql_12

4.5、possible_keys (可能用到的索引)

  1. 查询条件字段涉及到的索引,可能没有使用。
  2. explain 时可能出现 possible_keys 有列,而 key 显示 NULL 的情况,这种情况是因为表中数据不多,mysql认为索引对此查询帮助不大,选择了全表查询。
  3. 如果该列是NULL,则没有相关的索引。在这种情况下,可以通过检查 where 子句看是否可以创造一个适当的索引来提高查询性能,然后用 explain 查看效果

4.6、key (实际使用的索引)

实际使用的索引。如果为 NULL,则没有使用索引。
如果想强制mysql使用或忽视possible_keys列中的索引,在查询中使用 forceindex、ignore index。

4.7、key_len (索引的长度)

表示索引中使用的字节数,查询中使用的索引的长度(最大可能长度),并非实际使用长度,理论上长度越短越好。key_len 是根据表定义计算而得的,不是通过表内检索出的。

例子:

film_actor的联合索引 idx_film_actor_id 由 film_id 和 actor_id 两个int列组成,并且每个int是4字节。通过结果中的key_len=4可推断出查询使用了第一个列:film_id列来执行索引查找。

explain select * from film_actor where film_id = 2;

dbeaver mysql 执行计划 成本 mysql执行计划怎么生成的_MySQL_13


dbeaver mysql 执行计划 成本 mysql执行计划怎么生成的_子查询_14

4.8、ref

显示索引的哪一列被使用了,如果可能的话,是一个常量 const。

4.9、rows

根据表统计信息及索引选用情况,大致估算出找到所需的记录所需要读取的行数。注意这个不是结果集里的行数, 数值越低越好。

4.10、fitered

显示了通过条件过滤出的行数的百分比估计值。

4.11、Extra (额外的)

MYSQL 如何解析查询的额外信息。

  1. Distinct: MySQL 发现第 1 个匹配行后,停止为当前的行组合搜索更多的行。
  2. Not exists:MySQL 能够对查询进行 LEFT JOIN 优化,发现 1 个匹配 LEFT JOIN 标准的行后,不再为前面的的行组合在该表内检查更多的行。
  3. range checked for each record (index map: #):MySQL 没有发现好的可以使用的索引,但发现如果来自前面的表的列值已知,可能部分索引可以使用。
  4. Using filesort: 说明mysql会对数据使用**一个外部的索引排序,而不是按照表内的索引顺序进行读取。Mysql中无法利用索引完成的排序操作称为“文件排序”**这种情况下一般也是要考虑使用索引来优化的。
    4.1. actor.name未创建索引,会浏览actor整个表,保存排序关键字name和对应的id,然后排序name并检索行记录
    explain select * from actor order by name;
  5. dbeaver mysql 执行计划 成本 mysql执行计划怎么生成的_mysql_15

  6. 4.2. film.name建立了idx_name索引,此时查询时extra是using index
    explain select * from film order by name;
  7. dbeaver mysql 执行计划 成本 mysql执行计划怎么生成的_MySQL_16

  8. Using index: 表示相应的select操作中使用了覆盖索引,避免访问了表的数据行,效率不错!
    如果同时出现了using where,表明索引被用来执行索引键值的查找;
    如果没有同时出现using where,表明索引用来读取数据而非执行查找动作
    explain select film_id from film_actor where film_id = 1;
  9. dbeaver mysql 执行计划 成本 mysql执行计划怎么生成的_MySQL_17

  10. Using temporary:为了解决查询,MySQL 需要创建一个临时表来容纳结果。使用了临时表保存中间结果。常见于排序order by和分组查询group by。
    Using filesort和Using temporary都是不太好的结果,会影响性能。
    6.1. actor.name没有索引,此时创建了张临时表来distinct
    explain select distinct name from actor;
  11. dbeaver mysql 执行计划 成本 mysql执行计划怎么生成的_子查询_18

  12. 6.2. film.name建立了idx_name索引,此时查询时extra是using index,没有用临时表
    explain select distinct name from film;
  13. dbeaver mysql 执行计划 成本 mysql执行计划怎么生成的_mysql_19

  14. Using where: 表示使用了where过滤。
    explain select * from actor where name = ‘a’;
  15. Using sort_union(…), Using union(…), Using intersect(…): 这 些 函 数 说 明 如 何 为index_merge 联接类型合并索引扫描。
  16. Using index for group-by:类似于访问表的 Using index 方式,Using index for group-by 表示MySQL发现了一个索引,可以用来查 询GROUP BY或DISTINCT查询的所有列,而不要额外搜索硬盘访问实际的表。