随着用户量的增加 后台服务经常需要部署在多台服务器或者集群中来提高性能和增强可用性 在提供服务的过程中 由于程序bug或者业务徒增导致CPU飙高 如果CPU持续飙高 可能会导致机器down机 对服务造成不可用。
所以 及时发现CPU资源紧张 并发出告警非常重要。
本文以此为背景 在主机监控时序数据中 配置SLS告警 来监控主机CPU飙高 并且在CPU飙高时发出告警到钉钉机器人
行动策略是指告警触发后 需要执行什么动作 比如可以发送邮件 发送钉钉 调用webhook等 这里以首次配置行动策略为例 来讲如何新增行动策略。
点击新增 会跳转到创建行动策略页面 当前页面不要关闭。接下来在界面上配置行动策略 填写行动策略ID和行动策略名称 点击行动的小icon(上图红框位置) 添加通知渠道 这里通知渠道例子使用钉钉机器人来通知 需要事先配置好钉钉机器人[参考] 注意钉钉机器人的安全设置 可以启用自定义关键词 填入“告警” 行动组 选择渠道钉钉 请求地址写钉钉机器人的Webhook 内容模板选择默认模板【内容模板参考】点击结束按钮至此 一个监控主机CPU飙高的告警例子就完成了。这里只是一个简单的告警项目 演示了告警的一些基本功能 SLS告警具有非常强大的功能 新版告警提供对日志、时序等各类数据的告警监控 亦可接受三方告警 对告警进行降噪、事件管理、通知管理等 新增40 功能场景 充分考虑研发、运维、安全以及运营人员的告警监控运维需求。【参考】
想了解更多内容,请访问: 51CTO和华为官方战略合作共建的鸿蒙技术社区 https://...
本文转载自微信公众号「bugstack虫洞栈」,作者小傅哥 。转载本文请联系bugstack...
背景 我们知道 如果在Kubernetes中支持GPU设备调度 需要做如下的工作 节点上安装...
在Python开发过程中,我们难免会遇到多重条件判断的情况的情况,此时除了用很多...
TIOBE 公布了 2021 年 3 月的编程语言排行榜。 本月 TIOBE 指数没有什么有趣的变...
近几年,互联网行业蓬勃发展,在互联网浪潮的冲击下,互联网创业已成为一种比较...
本文转载自公众号读芯术(ID:AI_Discovery)。 这一刻你正在应对什么挑战?这位前...
基本介绍 给定 n 个权值作为 n 个叶子节点,构造一颗二叉树,若该树的带权路径长...
溢价 域名 的续费价格如何?通常来说,因为溢价域名的价值高于普通域名,所以溢...
前言 统计科学家使用交互式的统计工具(比如R)来回答数据中的问题,获得全景的认...