当前位置：主页 > 查看内容

MySQL limit导致的执行计划差异

发布时间：2021-04-30 00:00| 有位朋友查看

简介：今天收到一个业务的报警，提示慢日志比较频繁，登上环境查看，发现SQL是一条看起来很简单的语句，环境在MySQL 5.7.16版本下，慢日志里面执行时间显示是近1分钟，我在从库上面执行了一下，发现优化空间确实很大： select OrgId from `testcomm`.apply_join_or……

今天收到一个业务的报警，提示慢日志比较频繁，登上环境查看，发现SQL是一条看起来很简单的语句，环境在MySQL 5.7.16版本下，慢日志里面执行时间显示是近1分钟，我在从库上面执行了一下，发现优化空间确实很大：

select OrgId 
from `testcomm`.apply_join_org 
where IfDel=1 and ApplyStatus=1 and UserId = 12345678 ORDER BY CreateTime desc LIMIT 1; 
Empty set (48.71 sec)

执行计划如下:

explain select OrgId 
    -> from `testcomm`.apply_join_org 
    ->  where IfDel=1 and ApplyStatus=1 and UserId = 12345678 ORDER BY CreateTime desc LIMIT 1\G 
*************************** 1. row *************************** 
           id: 1 
  select_type: SIMPLE 
        table: apply_join_org 
   partitions: NULL 
         type: index 
possible_keys: IndexRTUser 
          key: IndexCreateTime 
      key_len: 5 
          ref: NULL 
         rows: 4332 
     filtered: 0.00 
        Extra: Using where 
1 row in set, 1 warning (0.00 sec)

到了这个时候，不上表结构有些草率了，结构有所删减。

CREATE TABLE `apply_join_org` ( 
  `ApplyJoinId` int(11) NOT NULL AUTO_INCREMENT, 
  `RTId` int(11) DEFAULT NULL, 
  `UserId` int(11) NOT NULL, 
  `OrgId` int(11) NOT NULL, 
  `ApplyMsg` varchar(100) DEFAULT NULL, 
  `CreateTime` datetime NOT NULL, 
  `ReplyMemId` int(11) DEFAULT '0', 
  `ReplyTime` datetime NOT NULL, 
  `ApplyStatus` tinyint(4) DEFAULT '1' COMMENT '0拒绝1申请2同意', 
  `IfDel` tinyint(4) DEFAULT '1', 
  `UpdateTime` timestamp NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP, 
  `RP` int(11) DEFAULT '0' COMMENT 'RP值', 
  `sex` tinyint(1) DEFAULT NULL, 
  `IfLeaguer` tinyint(1) NOT NULL DEFAULT '0', 
  PRIMARY KEY (`ApplyJoinId`), 
  KEY `IndexOrgIdStatus` (`OrgId`,`ApplyStatus`,`IfDel`), 
  KEY `IndexRTUser` (`UserId`), 
  KEY `IndexCreateTime` (`CreateTime`) USING BTREE 
) ENGINE=InnoDB AUTO_INCREMENT=22495957 DEFAULT CHARSET=utf8  
1 row in set (0.00 sec)

此外涉及的这张表的数据量有2000万左右，从目前的执行效率来看，无疑于走了一个全表扫描。

其实这个问题到了这个还是比较好理解的。从语句的表现，结合表结构，我们可以感觉到：整个SQL的执行过程中，原本是基于字段UserId，没想到却因为order by中的CreateTime，导致索引选择错误，执行代价差异很大。

所以到了这里，我们如何来定性这个问题：

1)是因为order by导致的吗?

2)是因为时间字段的排序导致的吗?

3)是因为limit操作导致的吗?

4)是因为userid本身的数据过滤效果差导致的吗?

对于这些疑问，我们可以很快通过几条对比SQL就能够快速验证。

通过如下的SQL可以看到order by不是最主要的原因

select OrgId 
    ->      from `testcomm`.apply_join_org 
    ->       where IfDel=1 and ApplyStatus=1 and UserId = 12345678 ORDER BY CreateTime ; 
Empty set (0.01 sec

order by排序也不是最主要的原因

select OrgId 
    -> from `testcomm`.apply_join_org 
    ->  where IfDel=1 and ApplyStatus=1 and UserId = 12345678 ORDER BY CreateTime desc ; 
Empty set (0.01 sec)

order by排序+limit 10也不是最主要的原因

select OrgId 
from `testcomm`.apply_join_org 
where IfDel=1 and ApplyStatus=1 and UserId = 12345678 ORDER BY CreateTime desc LIMIT 10; 
Empty set (0.01 sec)

order by 排序+limit 2也不是最主要的原因

select OrgId 
    -> from `testcomm`.apply_join_org 
    ->  where IfDel=1 and ApplyStatus=1 and UserId = 12345678 ORDER BY CreateTime desc LIMIT 2; 
Empty set (0.01 sec)

而经过这些对比，主要加入了limit 1，索引选择情况就会发生变化。我们抓取一条limit 2的执行计划来看看。可以明显看到type为ref,此外ref部分差异很大(const)。

>explain select OrgId  from `testcomm`.apply_join_org   where IfDel=1 and ApplyStatus=1 and UserId = 12345678 ORDER BY CreateTime desc LIMIT 2\G 
*************************** 1. row *************************** 
           id: 1 
  select_type: SIMPLE 
        table: apply_join_org 
   partitions: NULL 
         type: ref 
possible_keys: IndexRTUser 
          key: IndexRTUser 
      key_len: 4 
          ref: const 
         rows: 4854 
     filtered: 1.00 
        Extra: Using index condition; Using where; Using filesort 
1 row in set, 1 warning (0.00 sec)

如果想得到更进一步的信息，可以使用如下的方式：

SET optimizer_trace="enabled=on" 
SELECT * FROM INFORMATION_SCHEMA.OPTIMIZER_TRACE\G

查看

reconsidering_access_paths_for_index_ordering部分的信息会是关键所在。

"index_provides_order": true,

"order_direction": "desc",

而对于这个问题的分析，主要还是在于对于cost的评估方式，显然在目前的测试中，增加了额外的order by排序操作，导致了代价会略微高一些，而在优化器中在评估中，显然这部分是缺失了一些信息导致判断失误。

有如下几种方式可以修复：

1)补充完整的复合索引，userid和CreateTime能够做到互补，该方案已经在同构环境中做了完整的模拟测试，能够达到预期

alter table  `testcomm`.apply_join_org drop key IndexRTUser; 
alter table  `testcomm`.apply_join_org add  key `IndexRTUser2`(UserId,CreateTime);

2)使用force index的hint方式来强制索引，当然对于业务具有一定的侵入性

3)调整SQL逻辑模式，确实是否可以使用其他的方式来代替这种limit 1的使用模式。

而从长计议，其实整个评估中的优化器还是比较薄弱的，对于索引选择中的判断依据，如果有了直方图等辅助信息，整个过程会更加如虎添翼，这块的内容，准备在8.0中进行一些模拟测试，稍后奉上测试结果。

本文转载自微信公众号「杨建荣的学习笔记」，可以通过以下二维码关注。转载本文请联系杨建荣的学习笔记公众号。

本文转载自网络，原文链接：https://mp.weixin.qq.com/s/smIeqd8PPswsFwkwiYZdcA
本站部分内容转载于网络，版权归原作者所有，转载之目的在于传播更多优秀技术内容，如有侵权请联系QQ/微信：153890879删除，谢谢！

上一篇：忽视数据中心物理基础设施的现代化将产生四大问题 下一篇：鸿蒙开源第三方组件-进度轮ProgressWheel

随机推荐

ASP(VBScript)中整除和取余

整除 ASP(VBScript) 中整除用“\”，比如 m = 5 \ 2，结果为 2。取余 ASP(VBScr...
ajax实现上传图片保存到后台并读取的实例

上传图片有两种方式： 1.fileReader 可以把图片解析成base64码的格式，简单粗暴 ...
IE浏览器HTML Hack标签总结

复制代码代码如下: !--[if !IE]!-- 除IE外都可识别 !--![endif]-- !--[if IE] ...
即刻报名 | Flutter Engage China 线上见

在刚刚过去的 Flutter Engage 活动上，我们正式发布了 Flutter 2 : 为任何平台创...
ASP.NET开源导入导出库Magicodes.IE完成C

说明本章主要说明如何使用Magicodes.IE.Csv进行Csv导入导出. 关于Magicodes.IE ...
React Navigation 5.x版本实战指南

如果你想了解React Navigation 5.x的基本的概念，可以查看我之前的发的一篇文章...
CKEditor 附插入代码的插件

按照惯例，先来段废话：CKEditor是新一代的FCKeditor，是一个重新开发的版本。CK...
阿里一面，给了几条SQL，问需要执行几次

前言有位朋友去阿里面试，他说面试官给了几条查询SQL，问:需要执行几次树搜索操...
大数据就业的三大方向和最热门十大岗位【

当下，大数据方面的就业主要有三大方向：一是数据分析类大数据人才，二是系统...
phpstorm激活码2020附使用详细教程

phpstorm是由JetBrains公司开发的一款功能强大的PHP集成开发工具，可深刻理解用...

MySQL limit导致的执行计划差异

推荐图文

如何封装Vue Element的table表格组件

DataGridView使用BindingNavigator实现简单分页功能

Windows 10又出Bug！更新导致备份受影响了

C# 校验帮助类正则表达式

为什么PB级分析型数据库ClickHouse这么快？

Ajax基础与登入教程

随机推荐

ASP(VBScript)中整除和取余

ajax实现上传图片保存到后台并读取的实例

IE浏览器HTML Hack标签总结

即刻报名 | Flutter Engage China 线上见

ASP.NET开源导入导出库Magicodes.IE完成C

React Navigation 5.x版本实战指南

CKEditor 附插入代码的插件

阿里一面，给了几条SQL，问需要执行几次

大数据就业的三大方向和最热门十大岗位【

phpstorm激活码2020附使用详细教程

关于我们