前提:最近在测一个SQL诊断的功能,要求输入SQL语句,可以对SQL语句进行诊断,分析SQL语句的执行计划,最终生成SQL优化建议。

涉及的知识点包括:explain命令和简单的索引优化。

1.SQL语句执行计划

首先可以通过SQL语句自带的explain命令查看SQL语句的执行计划。查看该SQL语句有没有使用上了索引,有没有做全表扫描等。

mysql> explain select * from sc;
+----+-------------+-------+------------+------+---------------+------+---------+------+------+----------+-------+
| id | select_type | table | partitions | type | possible_keys | key  | key_len | ref  | rows | filtered | Extra |
+----+-------------+-------+------------+------+---------------+------+---------+------+------+----------+-------+
|  1 | SIMPLE      | sc    | NULL       | ALL  | NULL          | NULL | NULL    | NULL |    1 |   100.00 | NULL  |
+----+-------------+-------+------------+------+---------------+------+---------+------+------+----------+-------+
1 row in set, 1 warning (0.01 sec)

expain出来的信息有12列,分别是id、select_type、table、partitions、type、possible_keys、key、key_len、ref、rows、filtered、Extra,下面对这些字段出现的可能进行解释:

1.id

当sql语句中有子查询和关联查询时会显示多列,id用于标志多列数据。

2.select_type

用于表示是简单还是复杂的查询

SIMPLE:简单SELECT(不使用UNION或子查询)
PRIMARY:查询中若包含任何复杂的子部分,最外层查询则被标记为:PRIMARY
SUBQUERY:在SELECT或WHERE列表中包含了子查询,该子查询被标记为:SUBQUERY
DERIVED:在FROM列表中包含的子查询被标记为:DERIVED(衍生)用来表示包含在from子句中的子查询的select,mysql会递归执行并将结果放到一个临时表中。
DERIVED:若第二个SELECT出现在UNION之后,则被标记为UNION;若UNION包含在FROM子句的子查询中,外层SELECT将被标记为:DERIVED。
SUBQUERY和UNION还可以被标记为DEPENDENT和UNCACHEABLE。
UNION RESULT:从UNION表获取结果的SELECT被标记为:UNION RESULT。
DEPENDENT意味着select依赖于外层查询中发现的数据。
UNCACHEABLE意味着select中的某些 特性阻止结果被缓存于一个item_cache中。

3.table

一般情况下为表名。

4.partitions

版本5.7以前,该项是explain partitions显示的选项,5.7以后成为了默认选项。该列显示的为分区表命中的分区情况。非分区表该字段为空(null)。

5.type

访问类型,表示mysql在表中找到所需行的方式,从最差到最优依次如下:

(1)ALL:全表扫描,通常意味着mysql必须扫描整张表,从头到尾去找到所需要的行。
(2)index:这和全表扫描一样,只是mysql在扫描表示按索引次序进行而不是行,他的主要优点是避免了排序,最大的缺点是承担按索引次数读取整张表的开销。如果Extra字段看到Using index,说明Mysql正在使用覆盖索引,他比按索引次序全表扫描开销要少得多。
(3)range:范围扫描就是一个有限制的索引扫描,它开始于索引的某一点,返回匹配这个值域的行。这比全索引扫描要好一些,因为它用不着遍历全部索引。显而易见的范围扫描时带有between或者where>,当mysql使用索引去查找in()和or时也会显示range。但是这两者在性能上有很重要的差异。
(4)ref:这是一种索引访问(索引查找),它返回所有匹配某个单个值得行,然而它可能找到多个符合条件的行,因此它是查找和扫描的混合体。此类索引的扫描只有在使用非唯一索引或者唯一索引的非唯一前缀时才发生。
(5)eq_ref:使用这种索引查找,mysql最多只返回一条记录。这种访问方法在使用mysql主键或者唯一索引查找时看到。它会将他们与某个参考值作比较。
(6)const,system 当mysql能够从某部分进行优化将其转换为一个常量时,它就会使用这些访问类型。比如如下查询:explain select id from mis_audit_comment where id = 1\G;
(7)NULL 这种访问方式意味着Mysql能在优化阶段分解查询语句,在执行阶段甚至用不着访问表和索引。

6.possible_key

显示查询可以使用的索引。

7.key

显示mysql决定使用哪个索引来优化对表的访问。

8. key_len

mysql在索引里使用的字节数,可以根据key_len计算出该索引正在使用哪些列。可以根据key_len查看sql语句使用联合索引的情况。当有多列索引(audit_status,status,create_time)时,key_len为2时,表示只用了第一个为small int的索引。

9.ref

显示table在key中选取的索引中查找值所用的列或者常量。
10.row

mysql估计为了找到所需的行而要读取的行数。是mysql认为它要检查的行数,而不是结果集里的行数。

11.filtered

使用explain extended时会出现这个列,5.7之后的版本默认就有这个字段,不需要使用explain extended了。这个字段表示存储引擎返回的数据在server层过滤后,剩下多少满足查询的记录数量的比例,注意是百分比,不是具体记录数。

12.Extra

记录了不适合在其他列中显示的额外信息

(1)Using index:mysql将使用覆盖索引,以避免访问表。
(2)Using where:mysql服务器将在存储引擎检索行后再进行过滤。
(3)Using temporary:mysql在对结果排序时使用了临时表
(4)Using filesort:表示mysql使用一个外部索引排序,而不是按索引的顺序读取表。