客户A是一家多媒体类公司 主要产品有短视频App 用户可以在上面发短视频 其他用户可以看到用户发的短视频 客户A使用了阿里云OSS来存储用户产生的短视频 App每天的用户活动具有一定周期性 一般情况下深夜的PV较低 其他时段PV较高。一个典型的pv类似下图。
每天9点-10点之间的PV访问基本持平 如果5号9点-10点的PV是50万 6号9点-10点的PV是51万可以理解为正常波动 如果6号9-10点的PV突然变成了100万或者20万 应该告警出来 以提醒运营或者开发人员可能会出现问题
本文将以此为背景 配置SLS告警 来监控PV日环比是否有陡增或陡降 如果出现陡增或陡降 比如陡增10%或者陡降10% 发出告警 并发送到钉钉机器人。
主要步骤设置监控目标 OSS访问日志PV日环比变化配置告警规则 设置触发告警阈值设置行动策略 设置告警触发后的通知渠道接收告警通知__topic__: oss_access_log and http_status 400 | select diff[1] as curr, diff[2] as pre, round(diff[3]*100 - 100, 2) as ratio from ( select compare(pv, 86400) as diff from (SELECT count(client_ip) AS PV from log))
compare(列名, N) 用于对比当前时间周期内的结果 与N秒之前的时间周期内的计算结果 列名 目标列的列名。该列的值必须为double类型或long类型。返回值为数据[当前值,N秒前的值,当前值与N秒前的值的比值]通过 SELECT count(client_ip) AS PV from log求出当前时间周期 比如5分钟 的pv通过compare(pv, 86400)求出当前5分钟的pv 与一天前 86400秒 的同时期的5分钟的环比数据通过select diff[1] as curr, diff[2] as pre, round(diff[3]*100 - 100, 2) as ratio 求出当前5分钟pv curr , 昨天同时刻的pv pre 今天比昨天pv的增加百分比 ratio 查询结果示例配置告警规则在上述查询页面中 点击右上角另存为告警首次配置 每个用户仅需配置一次 需要选择告警中心Project的存储位置 告警中心Project中默认有一个internal-alert-center-log的logstore 免费 会存储一些告警的重要日志 还有三个重要报表供查询分析行动策略是指告警触发后 需要执行什么动作 比如可以发送邮件 发送钉钉 调用webhook等 这里以首次配置行动策略为例 来讲如何新增行动策略。
点击新增 会跳转到创建行动策略页面 当前页面不要关闭。接下来在界面上配置行动策略 填写行动策略ID和行动策略名称 点击行动的小icon(上图红框位置) 添加通知渠道 这里通知渠道例子使用钉钉机器人来通知 需要事先配置好钉钉机器人 注意钉钉机器人的安全设置 可以启用自定义关键词 填入“告警” 行动组 选择渠道钉钉 请求地址写钉钉机器人的Webhook 内容模板选择默认模板 关于内容模板可以【参考】 点击结束按钮至此 一个监控OSS PV昨日环比抖动的告警例子就完成了。这里只是一个简单的告警项目 演示了告警的一些基本功能 SLS告警具有非常强大的功能 新版告警提供对日志、时序等各类数据的告警监控 亦可接受三方告警 对告警进行降噪、事件管理、通知管理等 新增40 功能场景 充分考虑研发、运维、安全以及运营人员的告警监控运维需求。【参考】
在Python开发过程中,我们难免会遇到多重条件判断的情况的情况,此时除了用很多...
想了解更多内容,请访问: 51CTO和华为官方战略合作共建的鸿蒙技术社区 https://...
前言 统计科学家使用交互式的统计工具(比如R)来回答数据中的问题,获得全景的认...
溢价 域名 的续费价格如何?通常来说,因为溢价域名的价值高于普通域名,所以溢...
本文转载自微信公众号「bugstack虫洞栈」,作者小傅哥 。转载本文请联系bugstack...
基本介绍 给定 n 个权值作为 n 个叶子节点,构造一颗二叉树,若该树的带权路径长...
近几年,互联网行业蓬勃发展,在互联网浪潮的冲击下,互联网创业已成为一种比较...
本文转载自公众号读芯术(ID:AI_Discovery)。 这一刻你正在应对什么挑战?这位前...
背景 我们知道 如果在Kubernetes中支持GPU设备调度 需要做如下的工作 节点上安装...
TIOBE 公布了 2021 年 3 月的编程语言排行榜。 本月 TIOBE 指数没有什么有趣的变...