执行状态分析

l Sleep状态

n 通常代表资源未释放,如果是通过连接池,sleep状态应该恒定在一定数量范围内

n 实战范例:因前端数据输出时(特别是输出到用户终端)未及时关闭数据库连接,导致因网络连接速度产生大量sleep连接,在网速出现异常时,数据库too many connections挂死。

n 简单解读,数据查询和执行通常只需要不到0.01秒,而网络输出通常需要1秒左右甚至更长,原本数据连接在0.01秒即可释放,但是因为前端程序未执行close操作,直接输出结果,那么在结果未展现在用户桌面前,该数据库连接一直维持在sleep状态!

l Waiting for net, reading from net, writing to net

n 偶尔出现无妨

n 如大量出现,迅速检查数据库到前端的网络连接状态和流量

n 案例:因外挂程序,内网数据库大量读取,内网使用的百兆交换迅速爆满,导致大量连接阻塞在waiting for net,数据库连接过多崩溃

l Locked状态

n 有更新操作锁定

n 通常使用innodb可以很好的减少locked状态的产生,但是切记,更新操作要正确使用索引,即便是低频次更新操作也不能疏忽。如上影响结果集范例所示。

n 在myisam的时代,locked是很多高并发应用的噩梦。所以mysql官方也开始倾向于推荐innodb。

l Copy to tmp table

n 索引及现有结构无法涵盖查询条件,才会建立一个临时表来满足查询要求,产生巨大的恐怖的i/o压力。

n 很可怕的搜索语句会导致这样的情况,如果是数据分析,或者半夜的周期数据清理任务,偶尔出现,可以允许。频繁出现务必优化之。

n Copy to tmp table通常与连表查询有关,建议逐渐习惯不使用连表查询。

n 实战范例:

u 某社区数据库阻塞,求救,经查,其服务器存在多个数据库应用和网站,其中一个不常用的小网站数据库产生了一个恐怖的copy to tmp table操作,导致整个硬盘i/o和cpu压力超载。Kill掉该操作一切恢复。

l Sending data

n Sending data并不是发送数据,别被这个名字所欺骗,这是从物理磁盘获取数据的进程,如果你的影响结果集较多,那么就需要从不同的磁盘碎片去抽取数据,

n 偶尔出现该状态连接无碍。

n 回到上面影响结果集的问题,一般而言,如果sending data连接过多,通常是某查询的影响结果集过大,也就是查询的索引项不够优化。

n 如果出现大量相似的SQL语句出现在show proesslist列表中,并且都处于sending data状态,优化查询索引,记住用影响结果集的思路去思考。

l Storing result to query cache

n 出现这种状态,如果频繁出现,使用set profiling分析,如果存在资源开销在SQL整体开销的比例过大(即便是非常小的开销,看比例),则说明query cache碎片较多

n 使用flush query cache可即时清理,也可以做成定时任务

n Query cache参数可适当酌情设置。

l Freeing items

n 理论上这玩意不会出现很多。偶尔出现无碍

n 如果大量出现,内存,硬盘可能已经出现问题。比如硬盘满或损坏。

n i/o压力过大时,也可能出现Free items执行时间较长的情况。

l Sorting for …

n 和Sending data类似,结果集过大,排序条件没有索引化,需要在内存里排序,甚至需要创建临时结构排序。

l 其他

n 还有很多状态,遇到了,去查查资料。基本上我们遇到其他状态的阻塞较少,所以不关心