当前位置：主页 > 查看内容

记一次生产环境卡顿优化过程：大事务并发回滚

发布时间：2021-06-19 00:00| 有位朋友查看

简介：概述最近生产环境有这么个现象，平时的订单调度只需要2s内可以出结果，但是多个人调度就会卡住，超过15分钟都没有结果出来，有时还会失败然后导致数据不准确。下面记录一下生产环境卡顿时排查的过程。 1、获取ASH报告 SQL@?/rdbms/admin/ashrpt.sql --Tosp……

概述

最近生产环境有这么个现象，平时的订单调度只需要2s内可以出结果，但是多个人调度就会卡住，超过15分钟都没有结果出来，有时还会失败然后导致数据不准确。

下面记录一下生产环境卡顿时排查的过程。

1、获取ASH报告

SQL> @?/rdbms/admin/ashrpt.sql 
--To specify absolute begin time: 
--[MM/DD/YY]] HH24:MI[:SS] 
--08/09/19 08:40:00

2、ASH分析

（1）Top User Events

（2）相关sql

Top SQL with Top Events

sql明细

（3）存储过程

（4）TOP sessions

从上面分析可以看到两个明显的等待事件：wait for stopper event to be increased 等待事件和wait for a undo record 等待事件，这个应该是批量任务调度的时候产生了大量的大事务，产生了一些回滚造成了严重的资源消耗

3、处理大事务并发回滚

一般情况下wait for stopper event to be increased 等待事件是跟wait for a undo record 等待事件联系起来的。

对于这个等待事件metalink上面有一篇文档

464246.1 
Sometimes Parallel Rollback of Large Transaction may become very slow. After killing a large running transaction  
(either by killing the shadow process or aborting the database) then database seems to hang, or smon and parallel query servers  
taking all the available cpu. 
In fast-start parallel rollback, the background process Smon acts as a coordinator and rolls back a set of transactions in parallel  
using multiple server processes. Fast start parallel rollback is mainly useful when a system has transactions that run a long time  
before comitting, especially parallel Inserts, Updates, Deletes operations. When Smon discovers that the amount of recovery work is  
above a certain threshold, it automatically begins parallel rollback by dispersing the work among several parallel processes. 
There are cases where parallel transaction recovery is not as fast as serial transaction recovery, because the pq slaves are interfering 
with each other. It looks like the changes made by this transaction cannot be recovered in parallel without causing a performance problem.  
The parallel rollback slave processes are most likely contending for the same resource, which results in even worse rollback performance  
compared to a serial rollback.

解决的办法：

--关掉并发回滚，变成串行回滚（直接重启解决） 
sql> alter system set fast_start_parallel_rollback = false scope=spfile;

通常，如果有很多并发进程，可以根据v$px_session视图去查看，查看v$px_session视图，发现所有的并发进程都是由smon进程导致(即qcsid列为smon进程的session id)

而smon进程的等待事件为wait for stopper event to be increased

即smon进程在做大事务的回滚，默认参数fast_start_parallel_rollback参数为low，即回滚时会启动2*CPU个数个并发进程。而由于是使用并发，所以可能由于并发之间相互使用共同的资源，导致回滚速度更慢。因为是生产环境，不能随便重启，所以我用了下面的方法来修改这个参数：

（1）查找smon进程ID

select pid,spid,pname,username,tracefile from v$process where pname='SMON'

（2）禁用smon进程的事务清理(Disable SMON transaction cleanup)

oradebug setorapid 'SMON's Oracle PID'; 
 oradebug event 10513 trace name context forever, level 2

（3）查询V$FAST_START_SERVERS视图，将所有smon启用的并发进程杀掉

（4）修改fast_start_parallel_rollback参数

alter system set fast_start_parallel_rollback=false;

（5）启用smon进程的事务清理(enable transaction recovery)

oradebug setorapid 'SMON's Oracle PID'; 
oradebug event 10513 trace name context off

（6）获得tracefile name

oradebug tracefile_name

（7）验证

4、业务验证

修改后去业务验证，到高峰期还是有卡顿现象，不过频率减少了很多，报错之类的也没有了，同时观察新的报告可以发现并发回滚之类的等待事件已经没有了。

本文转载自网络，原文链接：https://www.toutiao.com/i6723515024679109123/
本站部分内容转载于网络，版权归原作者所有，转载之目的在于传播更多优秀技术内容，如有侵权请联系QQ/微信：153890879删除，谢谢！

上一篇：MongoDB数据库误删后的恢复 下一篇：SQLite，多个应用程序可以同时访问单个数据库文件吗？

随机推荐

正则表达式匹配，替换，查找

上篇文章给大家介绍了 Java正则表达式匹配，替换，查找，切割的方法，接下来，...
ASP调用远程XML数据的代码(alexa排名数据

复制代码代码如下: % URL="http://news.163.com/special/00011K6L/rss_newstop....
浅谈html特殊字符编码css3 content:＂我

项目中用到的一些特殊字符和图标 html代码 XML/HTML Code 复制内容到剪贴板 div ...
时序数据库的秘密 —— 快速检索

Elasticsearch 是通过 Lucene 的倒排索引技术实现比关系型数据库更快的过滤。特...
正则表达式中不区分大小写的写法

正则忽略大小写 – RegexOptions.IgnoreCase 例如：复制代码代码如下: Str = R...
asp 合并记录集并删除的sql语句

DELETEFROMTablesWHEREIDNOTIN(SELECTMin(ID)FROMTablesGROUPBYName) Min的话保...
jsp实现仿QQ空间新建多个相册名称并向相

工具：Eclipse，Oracle，smartupload.jar；语言：jsp，Java；数据存储：Oracle。...
未在本地计算机上注册“microsoft.ACE.ol

错误描述：在开发.net项目中，通过microsoft.ACE.oledb读取excel文件信息时，报...
区块链第2次学习讨论总结

4月11日20:30~22:00通过腾讯会议进行了第二次在线学习讨论我把学习笔记整理一下...
Laravel框架源码解析之反射的使用详解

本文实例讲述了Laravel框架源码解析之反射的使用。分享给大家供大家参考，具体如...

记一次生产环境卡顿优化过程：大事务并发回滚

推荐图文

Webpack知识整理———插件&提高开发体验

App公共测试用例梳理

ES2020让代码更优美的运算符 (?.) (??)

fckediter javascript事件函数代码

[译] APT分析报告：09.伊朗APT34更新武器库——Side

大厂都这样使用MySQL8进行条件查询

随机推荐

正则表达式匹配，替换，查找

ASP调用远程XML数据的代码(alexa排名数据

浅谈html特殊字符编码css3 content:＂我

时序数据库的秘密 —— 快速检索

正则表达式中不区分大小写的写法

asp 合并记录集并删除的sql语句

jsp实现仿QQ空间新建多个相册名称并向相

未在本地计算机上注册“microsoft.ACE.ol

区块链第2次学习讨论总结

Laravel框架源码解析之反射的使用详解

关于我们