数据库系统命令查看各项性能指标
show status;
show variables;
优化sql时需要知道sql语句的执行顺序,平时写SQL的时候:
select distinct... from... join...on...where...group by...having...order by...limit...
而实际数据库引擎在真正解析时,按
from...on...join...where...group by...having...select distinct...order by...limit...
执行。
MyISAM & InnoDB存储引擎 <——> InnoDB事务优先、行级锁、适合高并发场景 #### MyISAM性能优先、表级锁 MySQL默认存储引擎 InnoDB
连接层 ——> 服务层 ——> 引擎层 ——> 存储层 <—— mysql server
key_buffer_size <—— MyISAM的存储引擎的缓冲区大小,线程共享;大小为内存的1/16~1/8!
优化索引 <—— MySQL优化的主要手段
索引的数据结构,一般是树(默认B树)!R-树&Hash树&B树等
使用索引减少IO、从而提高查询速度!B树索引是一个排好序的数据结构。
索引弊端: 创建索引需要额外占用空间、降低写操作效率;
索引四大类:
主键索引、唯一索引、单列索引、组合索引
SQL执行计划十大参数解析
- id 编号
- select_type 查询类型
- table 表
- possible_keys 预测可能用到的索引
- key 实际使用的索引
- key_len 实际使用的索引的长度
- ref 表之间的引用
- rows 通过索引查询到的数据个数
- Extra 额外的信息
创建三张表、课程表course、教师表teacher、教师证表teacherCard
CREATE TABLE course (cid INT, cname VARCHAR(20), tid INT) ENGINE = INNODB;
CREATE TABLE teacher (tid INT, tname VARCHAR(20), tcid INT) ENGINE = INNODB;
CREATE TABLE teacherCard (tcid INT, tcdesc VARCHAR(200)) ENGINE = INNODB;
插入数据
CREATE TABLE course (cid INT, cname VARCHAR(20), tid INT) ENGINE = INNODB;
CREATE TABLE teacher (tid INT, tname VARCHAR(20), tcid INT) ENGINE = INNODB;
CREATE TABLE teacherCard (cid INT, tcdesc VARCHAR(200)) ENGINE = INNODB;
INSERT INTO course SELECT 1,'Java',1;
INSERT INTO course SELECT 2,'C++',1;
INSERT INTO course SELECT 3,'sql',2;
INSERT INTO course SELECT 4,'C',3;
SELECT * FROM course
INSERT INTO teacher SELECT 1,'Jack',1;
INSERT INTO teacher SELECT 2,'Zuoluo',2;
INSERT INTO teacher SELECT 3,'Jeson',3;
SELECT * FROM teacher
INSERT INTO teachercard SELECT 3,'Jeson_Describe';
INSERT INTO teachercard SELECT 1,'Jack_Describe';
INSERT INTO teachercard SELECT 2,'Zuoluo_Describe';
SELECT * FROM teachercard
三张表之间的关系:
当id相同时,table按照从上往下执行,不同时,id越大越优先执行!
再像teacher表中增加3条记录,再看下执行计划!
t ——> tc ——> c 加记录之前
tc ——> c ——> t 加记录之后
为了增加查询效率,SQL引擎会先查询数量较少的表!
EXPLAIN SELECT tc.tcdesc FROM teachercard tc WHERE tc.tcid = (SELECT t.tcid FROM teacher t WHERE t.tid = (SELECT c.tid FROM course c WHERE c.cname = 'Java'))
- select_type:
表示SELECT的查询类型(SIMPLE、PRIMARY、SUBQUERY、DERIVED、UNION、UNION RESULT)
1、SIMPLE:简单的select查询,查询中不包含子查询或者union
2、PRIMARY:查询中包含任何复杂的子部分,最外层查询则被标记为primary
3、SUBQUERY:在select 或 where列表中包含了子查询
4、DERIVED:在from列表中包含的子查询被标记为derived(衍生),mysql或递归执行这些子查询,把结果放在零时表里
5、UNION:若第二个select出现在union之后,则被标记为union;若union包含在from子句的子查询中,外层select将被标记为derived
6、UNION RESULT:从union表获取结果的select
简单查询、主查询、子查询、衍生查询(当from子查询只有一张表、那么子查询就是一个Derived)、联合查询、告诉SQL编写者、哪些表之间存在UNION查询
衍生查询
EXPLAIN SELECT t.tname FROM (SELECT * FROM teacher WHERE tid in(1,2)) t ;
联合查询
EXPLAIN SELECT t.tname FROM (SELECT * FROM teacher WHERE tid = 1 UNION SELECT * FROM teacher WHERE tid = 2 ) t ;
type
表示使用的索引类型
system ——> const ——> eq_ref ——> ref ——> fulltext ——> ref_or_null ——> index_merge ——> unique_subquery ——> index_subquery ——> range ——> index ——> ALL
性能从高到低
1、system:表只有一行记录(等于系统表),这是const类型的特例,平时不会出现,可以忽略不计
2、const:表示通过索引一次就找到了,const用于比较primary key 或者 unique索引。因为只需匹配一行数据,所有很快。如果将主键置于where列表中,mysql就能将该查询转换为一个const
3、eq_ref:唯一性索引扫描,对于每个索引键,表中只有一条记录与之匹配。常见于主键 或 唯一索引扫描。
4、ref:非唯一性索引扫描,返回匹配某个单独值的所有行。本质是也是一种索引访问,它返回所有匹配某个单独值的行,然而他可能会找到多个符合条件的行,所以它应该属于查找和扫描的混合体
5、range:只检索给定范围的行,使用一个索引来选择行。key列显示使用了那个索引。一般就是在where语句中出现了bettween、<、>、in等的查询。这种索引列上的范围扫描比全索引扫描要好。只需要开始于某个点,结束于另一个点,不用扫描全部索引
6、index:Full Index Scan,index与ALL区别为index类型只遍历索引树。这通常为ALL块,应为索引文件通常比数据文件小。(Index与ALL虽然都是读全表,但index是从索引中读取,而ALL是从硬盘读取)
7、ALL:Full Table Scan,遍历全表以找到匹配的行
possible_keys
查询涉及到的字段上存在索引,则该索引将被列出,但不一定被查询实际使用
key
实际使用的索引,如果为NULL,则没有使用索引。
查询中如果使用了覆盖索引,则该索引仅出现在key列表中
key_len
表示索引中使用的字节数,查询中使用的索引的长度(最大可能长度),并非实际使用长度,理论上长度越短越好。key_len是根据表定义计算而得的,不是通过表内检索出的
UTF-8 编码 一个字符三个字节 允许null + 1个字节
ref
显示索引的那一列被使用了,如果可能,是一个常量const。
rows
根据表统计信息及索引选用情况,大致估算出找到所需的记录所需要读取的行数
Extra
不适合在其他字段中显示,但是十分重要的额外信息
1、Using filesort :
mysql对数据使用一个外部的索引排序,而不是按照表内的索引进行排序读取。也就是说mysql无法利用索引完成的排序操作成为“文件排序”
2、Using temporary:
使用临时表保存中间结果,也就是说mysql在对查询结果排序时使用了临时表,常见于order by 和 group by
3、Using index:
表示相应的select操作中使用了覆盖索引(Covering Index),避免了访问表的数据行,效率高
如果同时出现Using where,表明索引被用来执行索引键值的查找
如果没用同时出现Using where,表明索引用来读取数据而非执行查找动作
4、Using where :
使用了where过滤
5、Using join buffer :
使用了链接缓存
6、Impossible WHERE:
where子句的值总是false,不能用来获取任何元素
7、select tables optimized away:
在没有group by子句的情况下,基于索引优化MIN/MAX操作或者对于MyISAM存储引擎优化COUNT(*)操作,不必等到执行阶段在进行计算,查询执行计划生成的阶段即可完成优化
8、distinct:
优化distinct操作,在找到第一个匹配的元祖后即停止找同样值得动作
extra中出现以下2项意味着MYSQL根本不能使用索引,效率会受到重大影响。应尽可能对此进行优化。
extra项 | 说明 |
Using filesort | 表示MySQL会对结果使用一个外部索引排序,而不是从表里按索引次序读到相关内容。可能在内存或者磁盘上进行排序。MySQL中无法利用索引完成的排序操作称为"文件排序” |
Using temporary | 表示MySQL在对查询结果排序时使用临时表。常见于排序order by和分组查询group by |
查询过程:一条查询语句在MySQL中是如何工作的
【1】客户端发送一条查询给服务器;
【2】服务器先检查查询缓存,如果命中缓存,则立即返回存储在缓存中的结果。否则进入下一阶段;
【3】服务器进行SQL解析、预处理、再由优化器生成对应的执行计划(这个过程中任何语法等错误都可能终止查询);
语法解析器和预处理:MySQL 通过关键字将 SQL 语句进行解析,并生成一颗对应的 “解析树”。MySQL 解析器使用 MySQL 语法规则验证和解析查询。例如验证是否使用错误的关键字,或者使用关键字的顺序是否正确等,还会验证引号前后是否正确等。预处理器则根据一些 MySQL 规则进一步检查解析树是否合法(数据或数据列是否存在等)。预处理器会验证权限,通常很快。
【4】MySQL 根据优化器生成的执行计划,调用存储引擎的 API 来执行查询;
优化器:将语法树转化成执行计划。一条查询可以由多种执行方式,最终都返回相同的结果。优化器的作用就是找到其中最好的执行计划。MySQL 基于成本的优化器,它尝试预测一个查询使用某种执行计划的成本,并选择成本最小的一个。可以通过 SHOW STATUS LIKE 'Last_query_cost' 值得知 MySQL 计算的当前查询的成本。
【5】将结果返回给客户端,也会将结果存放到查询缓存中;
MySQL 客户端/服务端之间的通信协议是“半双工”的,意味着,在任何一个时刻,要么是由服务器向客户端发送数据,要么是客户端向服务器发送数据。