本章节主要介绍部分监控指标的告警策略,以及配置操作。在实际业务中,建议按照以下告警策略,配置监控指标的告警规则。
是否接近性能上限,表示当前资源支撑的性能为告警策略中设置的告警阈值,如果继续上升,业务可能出现问题。
指标名称 |
正常范围 |
告警策略 |
是否接近性能上限 |
指标说明和告警处理建议 |
---|---|---|---|---|
磁盘容量使用率 |
0~100 |
告警阈值:原始值>85 连续触发次数:3 告警级别:紧急 |
是 |
指标说明:该指标为从Kafka节点虚拟机层面采集的磁盘容量使用率。单位:%。 处理建议:出现该告警时,需要修改实例存储空间,具体操作,请参考变更实例规格。 |
CPU核均负载 |
0~2 |
告警阈值:原始值>1.5 连续触发次数:3 告警级别:重要 |
是 |
指标说明:该指标为从Kafka节点虚拟机层面采集的CPU每个核的平均负载。 处理建议:出现该告警时,需要修改实例基准带宽,即扩节点。具体操作,请参考变更实例规格。 |
内存使用率 |
0~100 |
告警阈值:原始值>85 连续触发次数:3 告警级别:紧急 |
是 |
指标说明:该指标为Kafka节点虚拟机层面采集的内存使用率。单位:%。 处理建议:出现该告警时,需要修改实例基准带宽,即扩节点。具体操作,请参考变更实例规格。 |
Kafka进程JVM堆内存使用率 |
0~100 |
告警阈值:原始值>85 连续触发次数:3 告警级别:紧急 |
是 |
指标说明:该指标从Kafka节点Kafka进程JVM中采集的堆内存使用率。单位:%。 处理建议:出现该告警时,需要修改实例基准带宽,即扩节点。具体操作,请参考变更实例规格。 |
此处请选择与您的应用服务相同的区域。
进入云监控该实例的监控指标页面。
跳转到创建告警规则页面。
创建告警规则操作,请查看云监控服务的用户指南“创建告警规则”。
今天讲述一下HBase相关的知识。首先HBase作为大数据发展初期伴随Google三大论文...
您可以在腾讯云控制台,查看物理专线或专用通道的网络监控数据,帮助您排查网络...
本文介绍日志服务Trace数据的格式。 日志服务Trace数据格式完全兼容 OpenTelemet...
1、云主机 的云计算节点部署的服务器全部采用高端的品牌服务器,每个用户独占主...
本文介绍如何通过阿里云的服务快速创建Sharepoint2016。 说明 本文示例由阿里云...
问题现象 使用Webshell登录应用失败。 可能原因 Webshell运行依赖 /bin/bash ,...
操作场景 当您的裸金属服务器需要跨POD通信时,可以为裸金属服务器添加一块增强...
云硬盘如何计费? 支持包年包月和按量计费。具体价格请参见 云硬盘计费概述。 如...
作为一种架构模式,云原生架构通过若干原则来对应用架构进行核心控制。这些原则...
基础数据结构的融合是成为庞大系统的基石。比如Redis中的跳跃表,数据库索引B+树...