当前位置：主页 > 查看内容

MySQL数据延迟跳动的问题分析

发布时间：2021-05-06 00:00| 有位朋友查看

简介：今天分析了另外一个关于数据库延迟跳动的问题，也算是比较典型，这个过程中也有一些分析问题的方法和技巧工参考。首先在高可用检测中，有一套环境的检测时断时续，经过排查发现是数据库产生了延迟，在登录到从库show slave status查看，会发现Seconds_behin……

今天分析了另外一个关于数据库延迟跳动的问题，也算是比较典型，这个过程中也有一些分析问题的方法和技巧工参考。

首先在高可用检测中，有一套环境的检测时断时续，经过排查发现是数据库产生了延迟，在登录到从库show slave status查看，会发现Seconds_behind_master的值是不断跳动的，即从0~39~0~39这样的频率不断跳动，让人很搓火。

查看数据库的相关日志发现竟然没有任何可以参考的日志记录，怎么分析这个问题呢，我们先来复现，于是我按照节奏抓取了3次问题出现的日志，即通过show slave status连续监测，抓取show slave status输出的结果保存下来，这样我们就得到了一个问题发生过程中的偏移量变化，而这个变化则是在SQLThread在回放过程中产生的问题。

比如下面的一段输出，我截取的是Slave端的relay log进行分析，相应的字段为Relay_Log_Pos

Slave_IO_State: Waiting for master to send event 
                  Master_Host: xxxx 
                  Master_User: dba_repl 
                  Master_Port: 4306 
                Connect_Retry: 60 
              Master_Log_File: mysqlbin.000044 
          Read_Master_Log_Pos: 386125369 
               Relay_Log_File: slave-relay-bin.000066 
                Relay_Log_Pos: 386125580 
        Relay_Master_Log_File: mysqlbin.000044

所以很快得到了偏移量的变化情况：385983806 ，386062813 ，386125580

接着我使用mysqlbinlog开始分析这些日志过程中的明细，根据如下的命令可以很快得到转储的日志中相关的表有3张。

# grep INSERT  relaylog_xxxx.dump |awk '{print $3 " " $4}'|sed 's/INTO//g'|sort|uniq 
 act_action_exec_info 
 act_join_desc 
 dic_subsidy_marketing_querylog_202008

我逐步分析了每张表的数据操作情况，得到的信息还是比较有限，继续做更进一步的分析，比如我们分析一下整个日志中的事务量大小：

# mysqlbinlog slave-relay-bin.000066 | grep "GTID$(printf '\t')last_committed" -B 1 \ 
>                                     | grep -E '^# at' | awk '{print $3}' \ 
>                                     | awk 'NR==1 {tmp=$1} NR>1 {print ($1-tmp);tmp=$1}' \ 
>                                     | sort -n -r | head -n 100 
mysqlbinlog: [Warning] unknown variable 'loose-default-character-set=utf8' 
5278 
5268 
5268 
5268 
5253 
5253 
5253 
5253 
5253

可以看到是5K左右，算是比较大了，而这些额外的信息从哪里获得呢，我在主库开启了general_log，这样就能够得到更细粒度的操作日志了。

进一步分析发现，整个业务使用了显示事务的方式：SET autocommit=0，整个事务中包含了几个大SQL,里面存储了很多操作日志明细，而且在事务操作过程中还基于Mybatis框架调用了多次select count(1) from xxx的操作。

经过和业务沟通也基本明确了以上问题。

本文转载自网络，原文链接：https://mp.weixin.qq.com/s?__biz=MjM5ODEzNDA4OA==&mid=2650317031&idx=2&sn=fa7d9933fd4644840091688c036a6ff9&chksm=bec368c089b4e1d64ee60211f86592b6c1e8837459878828887420eda16618138bed6b3c8f9c&mpshare=1&
本站部分内容转载于网络，版权归原作者所有，转载之目的在于传播更多优秀技术内容，如有侵权请联系QQ/微信：153890879删除，谢谢！

上一篇：必须了解的MySQL三大日志：binlog、redo log和undo log 下一篇：没有了

随机推荐

如何编写一个创建FTP站点的函数？

如何编写一个创建 FTP 站点的函数？ FunctionASTCreateFtpSite(IPAddress,RootDi...
使用Navicat将Oracle数据库导入到MySQL中

前言：解决Navicat连接Oracle数据库报错Cannot load OCI DLL问题，让Navicat成功...
数据分析必须要掌握的数据库与sql基础知

在数据分析面试中，有一类知识绝对是面试官重头考察的内容，但是很多人却常常忽...
ReactRouter的实现方法

ReactRouter的实现 ReactRouter 是 React 的核心组件，主要是作为 React 的路由...
图解 SQL，这也太形象了吧!

本文介绍关系数据库的设计思想：在 SQL 中，一切皆关系。在计算机领域有许多伟...
Vue实现摇一摇功能(兼容ios13.3以上)

最近做了个摇一摇类似的功能，使用的是shake.js，但在ios13.3之前的版本中可以触...
分布式锁的封装也很有讲究呀

分布式锁通常有很多选择，基于 Redis 的，基于 Zookeeper 的，基于数据库等等方...
【性能测试】性能测试基础：性能测试的概

目? 录引? 言 1? 性能测试的基本概念 2? 性能测试的分类 2.1 负载测试 2.2 压力...
bug 守恒定律再现：微软承认最新Windows1

3月12日消息微软现在已确认 2021 年 3 月的累积更新对连接到某些打印机的电脑造...
JSP实用教程之简易文件上传组件的实现方

前言本文主要给大家介绍的是关于JSP简易文件上传组件的实现方法，分享出来供大...

MySQL数据延迟跳动的问题分析

推荐图文

MySQL中主库跑太快，从库追不上怎么整？

jsp 中HttpClient中的POST方法实例详解

vim中tagbar配置以及打字时隐藏鼠标的方法

JSP 开发之THE SERVLET NAME ALREADY EXISTS.解决方

MySQL limit导致的执行计划差异

微软 Windows 10 新增一批“文件资源管理器”流畅设

随机推荐

如何编写一个创建FTP站点的函数？

使用Navicat将Oracle数据库导入到MySQL中

数据分析必须要掌握的数据库与sql基础知

ReactRouter的实现方法

图解 SQL，这也太形象了吧!

Vue实现摇一摇功能(兼容ios13.3以上)

分布式锁的封装也很有讲究呀

【性能测试】性能测试基础：性能测试的概

bug 守恒定律再现：微软承认最新Windows1

JSP实用教程之简易文件上传组件的实现方

关于我们