我们知道,数据库的查询功能是我们经常用到的,那么MySQL数据库是怎样进行查询的呢?本文我们就来介绍一下MySQL数据库的查询步骤以及缓存原理,接下来就让我们来一起了解一下这一部分内容。

当MySQL收到客户端发送的查询语句时,首先会检查缓存块中是否缓存中此语句的结果,如果有,则检查权限,如果能通过权限的检查则直接返回缓存块中的结果集,我们称之为命中缓存,此时会增加Qcache_hits变量的值。

如果在缓存中找不到此语句的缓存(此时会增加Com_select变量的值),则进入下一步:

1、MySQL解析器将查询语句分解成一个个标识,并建立一棵“解析树”,解析器会使用MySQL的语法解析和验证这个查询语句的标识的有效性及标识是否出现在适当的位置上,它还会检查字符串中的引号有没有闭合。

2、预处理器会检查此“解析树”中的表和列是否存在,列的别名是否混淆,最后就是对权限的检查,而这些检查特性是解析器不具备的,只能通过预处理器来完成。

3、如果前面两步都通过了检验,MySQL的优化器则对“解析树”进行优化,并根据所预测的执行成本来生成执行成本最低的执行计划。最后执行此计划,存储查询结果,返回结果集给客户端。

通过上述两个变量值,我们可以通过这个公式计算出缓存的命中率: Qcache_hits / (Qcache_hits_Com_select), 通过命中率来查看我们是否可以从缓存中获益。这里有一个问题就是:命中率的多少才是最好的呢?这个没有确定值的,要根据情况而定,如果命中的是那些要筛选大量数据才得到的结果的查询语句(比如说:GROUP BY, COUNT等),即使命中率很低,但这也是一个很好的命中率值。

任何不是从缓存块中取得数据的查询语句都称为:缓存错失(cache miss), 造成缓存错失有以下几种原因:

1、所发送的查询语句是不可缓存的,查询语句不可缓存的原因有两种:语句包含了不确定值,如CURRENT_DATE,。 所得到的结果集太大而无法将它保存到缓存中. 这两种原因造成的结果都会增加Qcache_not_cached变量的值, 我们可以查看这个变量的值来检查我们查询语句的缓存情况.

2、所发送的查询语句之前没有发送过(第一次发送), 所以也不会有什么缓存存在。

3、所发送的查询语句的结果集之前是存在于缓存中的,但由于内存不足,MySQL不得不将之前的一些缓存清除,以腾出空间来放置其它新的缓存结果。同样,数据的变更也会引发缓存的失效。比如(更新,删除,插入)。如果是数据的变量引起缓存的失效的话,我们可以通过查看Com_*变量的值来确认有多少查询语句更改了数据,这些变量为:Com_update, Com_delete等等

关于MySQL数据库的查询步骤与缓存原理的知识就介绍到这里了,希望本次的介绍能够对您有所收获!

转自:http://database.51cto.com/art/201108/281458.htm