首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

《MySQL系列》之 性能优化(二)

索引使用原则

? ? 索引由于其提供的优越的查询性能,似乎不使用索引就是一个愚蠢的行为了。但是使用索引,是要付出时间和空间的代价的。因此,索引虽好不可贪多。

? ?下面介绍几个索引的使用技巧和原则。

写操作比较频繁的列慎重加索引

? ?索引在提高查询速度的同时,也由于需要更新索引而带来了降低插入、删除和更新带索引列的速度的问题。一张数据表的索引越多,在写操作的时候性能下降的越厉害。

索引越多占用磁盘空间越大

? ? 与没有加索引比较,加索引会更快地使你的磁盘接近使用空间极限。

不要为输出列加索引

? ? 为查询条件、分组、连接条件的列加索引,而不是为查询输出结果的列加索引。

例如下面的查询语句:

所以可以考虑增加在????列上,而不是?。

考虑维度优势

? ? ?例如列的值包含:1、2、3、4、5,那么该列的维度就是5。

维度越高(理论上维度的最大值就是数据行的总数),数据列包含的独一无二的值就越多,索引的使用效果越好。

? ? ?对于维度很低的数据列,索引几乎不会起作用,因此没有必要加索引。

? ? 例如性别列的值只有男和女,每种查询结果占比大约50%。一般当查询优化处理器发现查询结果超过全表的30%的时候,就会跳过索引,直接进行全表扫描。

对短小的值加索引

? ? 对短小的值加索引,意味着索引所占的空间更小,可以减少I/O活动,同时比较索引的速度也更快。

? ? 尤其是主键,要尽可能短小。

? ? 另外,InnoDB使用的是聚集索引(clustered index),也就是把主键和数据行保存在一起。主键之外的其他索引都是二级索引,这些二级索引也保留着一份主键,这样在查询到索引以后,就可以根据主键找到对应的数据行。如果主键太长的话,会造成二级索引占用的空间变大。

为字符串前缀加索引

? ? ?前边已经讲过短小索引的种种好处了,有时候一个字符串的前几个字符就能唯一标识这条记录,这个时候设置索引的长度就是非常划算的做法。

? ? ?前面已经提供了设置索引的例子,这里就不举例子了。

复合索引的左侧索引

? ? 创建复合索引的语法如下:

我们可以看到,最左侧的column1索引总是有效的。

索引加锁

? ?对于InnoDB来说,索引可以让查询锁住更少的行,从而可以在并发情况下拥有更佳表现。

? ?下面演示一下查询锁与索引之间的关系。

? ? 前面使用的user_info_log表目前有一个为主键,还有一个二级索引。

下面这条语句的修改范围是值为???所在的行,查询锁会锁住值为????所在的行。

1、首先创建数据库连接1,开启事务,并执行update语句

2、然后开启另外一个连接2,分别执行下面几个update语句

你会发现的数据行已经被锁定,的数据行可以正常提交。

3、连接1提交事务,连接2的和的数据行可以update成功了。

4、如果不使用索引

没有索引的话,会锁定全表。

连接1开启事务以后之前,连接2对该表的update全部需要等待连接1释放锁。

覆盖索引

如果索引包含满足查询的所有数据,就被称为覆盖索引(Covering Indexes),覆盖索引非常强大,可以大大提高查询性能。

覆盖索引高性能的原因是:

索引通常比记录要小,覆盖索引查询只需要读索引,而不需要读记录。

索引都按照值的大小进行顺序存储,相比与随机访问记录,需要更少的I/0。

大多数数据引擎能更好的缓存索引,例如MyISAM只缓存索引。

user_info_log表的列包含索引。使用分析下面的查询语句,对于索引覆盖查询(index-covered query),分析结果的值是,表示使用了覆盖索引 :

聚簇索引

? ? ? 聚簇索引(Clustered Indexes)保证关键字的值相近的元组存储的物理位置也相同,且一个表只能有一个聚簇索引。

? ? ?字符串类型不建议使用聚簇索引,特别是随机字符串,因为它们会使系统进行大量的移动操作。

? ? ?并不是所有的存储引擎都支持聚簇索引,目前InnoDB支持。

? ? ?如果使用聚簇索引,最好使用列作为主键,应该尽量避免使用随机的聚簇主键。

? ? ?从物理位置上看,聚簇索引表比非聚簇的索引表,有更好的访问性能。

选择合适的索引类型

从数据结构角度来看,MySQL支持的索引类型有B树索引、Hash索引等。

B树索引

B树索引对于、 、!=、 between查询,进行精确比较操作和范围比较操作都有比较高的效率。

B树索引也是InnoDB存储引擎默认的索引结构。

Hash索引

Hash索引仅能满足=、、in查询。

Hash索引检索效率非常高,索引的检索可以一次定位,不像B树索引需要从根节点到枝节点,最后才能访问到页节点这样多次的I/O访问,所以Hash索引的查询效率要远高于B树索引。但Hash索引不能使用范围查询。

查询优化建议

下面提供几个查询优化的建议。

使用explain分析查询语句

前面已经演示过如何使用命令分析查询语句了,这里再解释一下其中几个有参考价值的字段的含义:

select_type

select_type表示查询中每个select子句的类型,一般有下面几个值:

SIMPLE 简单SELECT,不使用UNION或子查询等。

PRIMARY 查询中若包含任何复杂的子部分,最外层的select被标记为PRIMARY。

UNION UNION中的第二个或后面的SELECT语句。

DEPENDENT UNION UNION中的第二个或后面的SELECT语句,取决于外面的查询。

UNION RESULT UNION的结果。

SUBQUERY 子查询中的第一个SELECT。

DEPENDENT SUBQUERY 子查询中的第一个SELECT,取决于外面的查询。

DERIVED 派生表的SELECT, FROM子句的子查询。

UNCACHEABLE SUBQUERY 一个子查询的结果不能被缓存,必须重新评估外链接的第一行。

type

type表示MySQL在表中找到所需行的方式,又称“访问类型”,常用的类型有:

ALL, index, range, ref, eq_ref, const, system, NULL。

从左到右,性能从差到好。

ALL:Full Table Scan,MySQL将遍历全表以找到匹配的行。

index: Full Index Scan,index与ALL区别为index类型只遍历索引树。

range: 只检索给定范围的行,使用一个索引来选择行。

ref: 表示上述表的连接匹配条件,即哪些列或常量被用于查找索引列上的值。

eq_ref: 类似ref,区别就在使用的索引是唯一索引,对于每个索引键值,表中只有一条记录匹配,简单来说,就是多表连接中使用primary key或者 unique key作为关联条件。

const: 当MySQL对查询某部分进行优化,并转换为一个常量时,使用这些类型访问。如将主键置于where列表中,MySQL就能将该查询转换为一个常量。

NULL: MySQL在优化过程中分解语句,执行时甚至不用访问表或索引,例如从一个索引列里选取最小值可以通过单独索引查找完成。

Key

key列显示MySQL实际决定使用的键(索引),如果没有选择索引,键是NULL。

possible_keys

possible_keys指出MySQL能使用哪个索引在表中找到记录,查询涉及到的字段上如果存在索引则该索引将被列出,但不一定被查询使用。

ref

ref表示上述表的连接匹配条件,即哪些列或常量被用于查找索引列上的值。

rows

rows表示MySQL根据表统计信息,以及索引选用的情况,找到所需记录需要读取的行数。这个行数是估算的值,实际行数可能不同。

声明NOT NULL

当数据列被声明为NOT NULL以后,在查询的时候就不需要判断是否为NULL,由于减少了判断,可以降低复杂性,提高查询速度。

如果要表示数据列为空,可以使用0等代替。

考虑使用数值类型代替字符串

MySQL对数值类型的处理速度要远远快于字符串,而且数值类型往往更加节省空间。

例如对于“Male”和“Female”可以用“0”和“1”进行代替。

考虑使用ENUM类型

如果你的数据列的取值是确定有限的,可以使用ENUM类型代替字符串。因为MySQL会把这些值表示为一系列对应的数字,这样处理的速度会提高很多。

总结

索引是一个单独的,存储在磁盘上的数据结构,索引对数据表中一列或者多列值进行排序,索引包含着对数据表中所有数据的引用指针。

历史文章及资料

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20230116A001G000?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券
http://www.vxiaotou.com