浅谈性能瓶颈定位之MySQL慢查询

  • 2019 年 12 月 2 日
  • 笔记

在性能测试过程中,我们会发现各种各样的性能问题,其中数据库相关的问题尤为居多。在鄙人做过的项目中,超过40%以上性能问题是跟开发人员编写的SQL有关。今天从性能测试工程师角度谈谈如何定位mysql中的 SQL慢查询。

一、通过慢查询日志获取存在性能问题的SQL

鄙人所在公司的项目的测试流程如下:

问题来了,如何做到在功能测试结束后,性能测试开始前发现单元测试/API测试/功能测试中出现的慢查询以及未走索引的查询呢?答案就是:开启这两个测试环境的mysql数据库慢查询日志,然后在日志文件里自动记录这些慢查询,以及not using index的查询。下面做一个简单的演示:

通过客户端连上mysql数据库(这里演示用的是Navicat Premium),执行下面几个命令:

set global slow_query_log=on  /*开启慢查询日志*/set log_queries_not_using_indexes=on /*开启未用查询的日志*/set global slow_query_log= “你想要的路径” /*该演示里使用默认路径*/

然后,执行如下命令,可以看到慢查询日志已经打开,并且可以看到慢查询日志存放的路径。

Show variables like ‘%slow%’

到这里我们已经开启了慢查询以及未走索引的查询日志记录,但是还差一步,那就是多慢的查询算慢查询?鄙人所在微服务项目开发和测试讨论的结果是超过100毫秒的查询,都得记录分析调优。所以还需要执行:

Set long_query_time=0.1 /*超过100毫秒的都是慢查询*/

在测试开发环境和测试环境做完上面设置后,就可以定期取日志,看到我们想看的慢查询记录,以及没用用到索引的查询。下面是工作中的一个真实示例截图:

此外,还有一款工具叫pt-query-digest,用来分析统计慢查询日志,有兴趣可以下载使用试试。

pt-query-digest --explain h=127.0.0.1, u=root,p=wwwslow-mysql.log

二、实时获取慢查询

在性能测试执行过程中,有时会发现某一个非常慢,此刻就需要实时找出正在执行的慢查询。我们可以借助下面的命令实现:

select id, 'user','host,db,command,'time',state, infofrom information_schema.processlist where time >=0.1

这里的0.1秒可以根据自己需要调整,information_schema对应数据库的processlist表

三、分析利器Showprofiles

作为性能测试人员,在我的工作中比较少用showprofiles,其中一个主要原因是执行showprofiles后得到的数据虽然更详细,但对这些数据的使用无从下手。我们看看如何使用这个工具:

set profiling = ON; /*开启profiling功能*/show variables like "profiling";  /*查看开启是否生效*/show profiles /*开启profile收集到所有sql执行的profile*/
Show profile for query 65 /*查看query_id为65的query对应时间花在什么地方了*/
show profile block io,cpu for query 65 /*查看query id为65的对应cpu, io等信息*/

四、explain:真正的好帮手

上面主要讲了怎么找到慢查询,有了慢查询sql后,我们怎么分析呢?借助explain。

一个典型的sql语句执行过程如下:

①、客户端发送sql请求给服务器

②、服务器端检查是否可以在查询缓存中命中该sql

③、服务器端进行sql解析,预处理,再由优化器生成执行计划

④、依据执行计划,调用存储引擎API来查询数据

⑤、结果返回给客户端

这里我们着重讲讲第四点执行计划,如何用explain去查看分析执行计划。:

简单使用 explain+ sql 语句来查看执行计划:

主要关注id(执行顺序)、type(表的扫描方式)、rows(检索数据需要扫描的行)、key(使用到的索引)、key_len(索引长度),extra(额外信息)。

示例1:explain语句分析发现“索引字段进行数学运算和函数运算,导致索引失效”

Payment表的paytime字段建立了索引,执行explain + SQL语句,我们可以看到:

Type=ALL,key=null, rows=14661, extra: using where

说明该查询做了全表扫描,索引没有起作用。

在第二个查询里去掉了date_format(),执行 exaplain + SQL语句,我们可以看到:

Type=range, key=payment_index3, rows=344, Extra:using index

这就是通过explain工具分析发现“索引字段进行数学运算和函数运算,导致索引失效”

示例2:explain语句分析发现“包含or的多条件查询无法通过索引检索数据,走全表扫描”

select  * fromXXX_login_account  where  actived=1 and (mobile =18504000006 orCREATE_time > '2019-07-03');

分析该表的索引,mobile和create_time都有索引,但是从执行计划看,没有走索引,走的是全表扫描:

同步到开发同事后,优化SQL,优化后的SQL分析如下:

如上图所示,index生效。