当前位置：主页 > 查看内容

这句简单的SQL，如何加索引？颠覆了我多年的认知

发布时间：2021-06-06 00:00| 有位朋友查看

简介：不啰嗦，直接入正题。问题是这样的。请问下面的sql语句，要想加快查询速度，该怎么创建索引?以下，以mysql数据库为准。 select*fromtestwhere a =?andb ?orderbyclimit0,100 结果可能会出乎你的意料。我们首先准备一下运行环境，然后按照最左前缀原则和expla……

不啰嗦，直接入正题。问题是这样的。请问下面的sql语句，要想加快查询速度，该怎么创建索引?以下，以mysql数据库为准。

select * from test where a=? and b>? order by c limit 0,100

结果可能会出乎你的意料。我们首先准备一下运行环境，然后按照最左前缀原则和explain关键字来进行验证。结果真是颠覆了xjjdog多年的认知。

准备阶段

为了进行验证，我们创建一个简单的数据表。里面有a、b、c三个简单的int字段。

CREATE TABLE `test` ( 
  `id` int(11) NOT NULL, 
  `a` int(11) DEFAULT NULL, 
  `b` int(11) DEFAULT NULL, 
  `c` int(11) DEFAULT NULL, 
  PRIMARY KEY (`id`) 
) ENGINE=InnoDB DEFAULT CHARSET=utf8

接下来，写一个简单的存储过程，来插入10w条数据。等待大约1分钟，数据插入完毕。

DROP PROCEDURE IF EXISTS test_initData; 
DELIMITER $ 
CREATE PROCEDURE test_initData() 
BEGIN 
    DECLARE i INT DEFAULT 1; 
    WHILE i<=100000 DO 
        INSERT INTO test(id,a,b,c) VALUES(i,i*2,i*3,i*4); 
        SET ii = i+1; 
    END WHILE; 
END $ 
CALL test_initData();

由于mysql有最左前缀原则，我们对abc三列进行了全排列，创建了6个索引。这6个索引涵盖了所有的根据abc查询的情况。

create INDEX idx_a_b_c on test(a,b,c); 
create INDEX idx_a_c_b on test(a,c,b); 
create INDEX idx_b_a_c on test(b,a,c); 
create INDEX idx_b_c_a on test(b,c,a); 
create INDEX idx_c_a_b on test(c,a,b); 
create INDEX idx_c_b_a on test(c,b,a);

使用Explain进行验证

1. 自动选用索引

explain select * from test where a>10 and b >10  order by c

首先，我们拿上面的sql语句进行验证。结果发现，查询使用了索引idx_a_b_c，只用到了前缀a，b。而extra部分，则用到了filesort，也就是性能非常差的方式。

这句简单的sql，如何加索引？颠覆了我多年的认知

我们尝试换一下查询参数的位置。

explain select * from test where c>10 and b >10   order by a

这句简单的sql，如何加索引？颠覆了我多年的认知

这次索引自动选择了idx_b_a_c，但依然使用的filesort，查询效果是一样的。按照上面的逻辑，不是应该选择idx_b_c_a么?

2. 指定索引

接下来使用force index方式，强制指定索引。

这里直接给出结果，就是下面的sql。

explain select * from test 
   FORCE INDEX(idx_c_b_a)    where a>10 and b >10  order by c

结果如下。

这句简单的sql，如何加索引？颠覆了我多年的认知

我们使用force index来指定使用的索引。这次效果非常好，显示使用了index，使用了where，只在索引上就完成了操作。但扫描的行数却增加了。

但是，这与我们的经验是相悖的。idx_c_b_a的索引，是在字段(c,b,a)上创建的。按照最左原则，支持的搜索条件有：c,cb,cba。在这个例子中，order by后面的参数，却被当作了前缀的头部信息。

我们删掉其他索引，只留下idx_c_b_a，然后去掉force index部分。结果发现，mysql现在能够自动的选择索引了。

再看另外一种情况，order by上有两个参数。

explain select * from test 
   FORCE INDEX(idx_b_c_a) 
   where a>10   order by b,c

这句简单的sql，如何加索引？颠覆了我多年的认知

结果如上，使用idx_b_c_a，不走filesort。其他索引都不是最优。

3. explain部分返回值意义

我们得出上面的结论，是根据mysql自己提供的explain工具。这个工具能够输出一些有用的信息。下面是相关的部分返回值的意义。

(1) select_type

表示SELECT的类型，常见的取值有：

SIMPLE 简单表，不使用表连接或子查询。
PRIMARY 主查询，即外层的查询。
UNION UNION中的第二个或者后面的查询语句。
SUBQUERY 子查询中的第一个。

(2) type

表示MySQL在表中找到所需行的方式，或者叫访问类型。常见访问类型如下，从下到上，性能越来越差。

system,const 表只有一行记录(等于系统表)，这是const类型的特列。
eq_ref 唯一性索引扫描，对于每个索引键，表中只有一条记录与之匹配。
ref 非唯一性索引扫描，返回匹配某个单独值的所有行，本质上也是一种索引访问，它返回所有匹配某个单独值的行，然而，它可能会找到多个符合条件的行，所以他应该属于查找和扫描的混合体。
range 只检索给定范围的行，使用一个索引来选择行，key列显示使用了哪个索引。这种范围扫描索引比全表扫描要好，因为它只需要开始于索引的某一点，而结束于另一点，不用扫描全部索引。
index Full Index Scan，Index与All区别为index类型只遍历索引树。这通常比ALL快，因为索引文件通常比数据文件小。
all 全表扫描，性能最差

(3) Extra

using index：表示相应的select操作中使用了覆盖索引，避免访问了表的数据行，效率不错。如果同时出现using where，表明索引被用来执行索引键值的查找;如果没有同时出现using where，表明索引用来读取数据而非执行查找动作。
using filesort：说明mysql会对数据使用一个外部的索引排序，而不是按照表内的索引顺序进行读取。MySQL中无法利用索引完成的排序操作称为“文件排序”。
using temporary：使用了用临时表保存中间结果，mysql在对查询结果排序时使用临时表。常见于排序order by和分组查询group by。

End

可以看到，在我们创建了多个索引的时候，mysql的查询优化，并不一定能够进行智能的解析、用到最优的方式，需要使用force index指定索引。

mysql中的索引，主要就用在where条件中和排序动作中。分两种情况。

先过滤，再排序，会用到过滤条件中的索引参数，但是排序会使用较慢的外部排序。因为这个结果集是经过过滤的，并没有什么索引参与。
先排序，再过滤，可以使用同一个索引，排序的优先级高于过滤的优先级。选择合适的索引，在过滤的同时就把这个事给办了。但是扫描的行数会增加。

我想，mysql并不能够了解到这两个过程，到底谁快谁慢，于是选了一个最通用的方式，直接选用了第一种。甚至在索引非常多的时候，直接晕菜了。索引建多了，你可能间接把mysql给害了。这是现象，至于深层次的原因，欢迎读过mysql相关源码的给解释一下。

这对经常变换字段进行排序的代码来说，并不是一个好的信号。考虑到程序的稳定性，我想应该要尽量减少where条件过滤后的结果集。这种情况下，创建一个(a，b)的联合索引，或许是一个折衷的方式。

本文转载自网络，原文链接：http://mp.weixin.qq.com/s?__biz=MzA4MTc4NTUxNQ==&mid=2650520260&idx=1&sn=ab10083c4ccf5bf41566c979295dfc4c&chksm=8780bd00b0f73416e253a72460236b0e0ae860c212fecd02bf656f9725475f1c2432fa4ae3f1&mpshare=1&s
本站部分内容转载于网络，版权归原作者所有，转载之目的在于传播更多优秀技术内容，如有侵权请联系QQ/微信：153890879删除，谢谢！

上一篇：Docker容器部署Zabbix监控系统 下一篇：没有了

随机推荐

Centos7安装Mysql5.7最全教程

最近需要在Linux系统上使用MySQL记录一下安装过程吧为后来的同学排除一些问题、 ...
UEditor编辑文章出现多余空行问题的解决

新写的网站用UEditor做编辑器，结果发现每次编辑完都会多出首尾空行，像这样： ...
在Windows10中禁用PowerShell，保护电脑

Windows 10提供二种命令行界面：命令提示符和PowerShell。Windows PowerShell是...
a标签href属性与onclick事件使用实例

a标签主要用来实现页面跳转，可以通过href属性实现，也可以在onclick事件里实现...
html代码文本框限制输入文本框变灰色限

方法1：设置readonly属性为true。 INPUT value=readonly readOnly 方法2：设置di...
【详细+超基础】Java-学习笔记 00

Java学习笔记系列——孙不坚1208 【详细超基...
通过Response.Flush()实现下载失败的解决

通过Response.Flush()实现对服务端文件的下载时，会失败，不能正常弹出IE下载框...
人人都能看懂的 6 种限流实现方案(纯干货

为了上班方便，去年我把自己在北郊的房子租出去了，搬到了南郊，这样离我上班的...
几道和「黑洞照片」那种海量数据有关的算

昨晚被一则新闻刷屏：北京时间 4 月 10 日今晚 9 点，人类首张黑洞照片正式发布...
在IDEA2020.2中配置使用Git的详细教程

一、 idea中配置git 先配置好git的本地地址，然后test，出现版本号说明测试成功...

这句简单的SQL，如何加索引？颠覆了我多年的认知

推荐图文

div嵌套html不用iframe

5000多张数据表，如何用SQL迁移到数据仓库？

通过构造AJAX参数实现表单元素JSON相互转换

VS2019的安装使用及可能出现的问题的解决办法

JSP学习经验小结分享

XML轻松学习手册（3）XML的术语

随机推荐

Centos7安装Mysql5.7最全教程

UEditor编辑文章出现多余空行问题的解决

在Windows10中禁用PowerShell，保护电脑

a标签href属性与onclick事件使用实例

html代码文本框限制输入文本框变灰色限

【详细+超基础】Java-学习笔记 00

通过Response.Flush()实现下载失败的解决

人人都能看懂的 6 种限流实现方案(纯干货

几道和「黑洞照片」那种海量数据有关的算

在IDEA2020.2中配置使用Git的详细教程

关于我们