当前位置:主页 > 查看内容

必须配置的监控告警_分布式消息服务 Kafka_用户指南_监控

发布时间:2021-10-17 00:00| 位朋友查看

简介:本章节主要介绍部分监控指标的告警策略,以及配置操作。在实际业务中,建议按照以下告警策略,配置监控指标的告警规则。 是否接近性能上限 ,表示当前资源支撑的性能为告警策略中设置的告警阈值,如果继续上升,业务可能出现问题。 表1 Kafka实例配置告警的……

本章节主要介绍部分监控指标的告警策略,以及配置操作。在实际业务中,建议按照以下告警策略,配置监控指标的告警规则。

是否接近性能上限,表示当前资源支撑的性能为告警策略中设置的告警阈值,如果继续上升,业务可能出现问题。

表1 Kafka实例配置告警的指标

指标名称

正常范围

告警策略

是否接近性能上限

指标说明和告警处理建议

磁盘容量使用率

0~100

告警阈值:原始值>85

连续触发次数:3

告警级别:紧急

指标说明:该指标为从Kafka节点虚拟机层面采集的磁盘容量使用率。单位:%。

处理建议:出现该告警时,需要修改实例存储空间,具体操作,请参考变更实例规格

CPU核均负载

0~2

告警阈值:原始值>1.5

连续触发次数:3

告警级别:重要

指标说明:该指标为从Kafka节点虚拟机层面采集的CPU每个核的平均负载。

处理建议:出现该告警时,需要修改实例基准带宽,即扩节点。具体操作,请参考变更实例规格

内存使用率

0~100

告警阈值:原始值>85

连续触发次数:3

告警级别:紧急

指标说明:该指标为Kafka节点虚拟机层面采集的内存使用率。单位:%。

处理建议:出现该告警时,需要修改实例基准带宽,即扩节点。具体操作,请参考变更实例规格

Kafka进程JVM堆内存使用率

0~100

告警阈值:原始值>85

连续触发次数:3

告警级别:紧急

指标说明:该指标从Kafka节点Kafka进程JVM中采集的堆内存使用率。单位:%。

处理建议:出现该告警时,需要修改实例基准带宽,即扩节点。具体操作,请参考变更实例规格

操作步骤

  1. 登录管理控制台。
  2. 在管理控制台左上角单击,选择区域。

    此处请选择与您的应用服务相同的区域。

  3. 在页面左侧导航栏的“服务列表”中,选择“应用服务 > 分布式消息服务 Kafka”,进入分布式消息服务Kafka页面。
  4. 单击实例名称后的“更多 > 查看监控数据”。

    进入云监控该实例的监控指标页面。

  5. 在实例监控指标页面中,找到需要创建告警的指标项,鼠标移动到指标区域,然后单击指标右上角的,创建告警规则。

    跳转到创建告警规则页面。

  6. 在告警规则页面,设置告警信息。

    创建告警规则操作,请查看云监控服务的用户指南“创建告警规则”。

    1. 设置告警名称和告警的描述。
    2. 设置告警策略和告警级别。

      如下图所示,在进行指标监控时,如果连续3个周期,磁盘容量使用率原始值超过85%,则产生告警,如果未及时处理,则产生告警通知。

      图1 设置告警策略和告警级别
    3. 设置“发送通知”开关。当开启时,设置告警生效时间、产生告警时通知的对象以及触发的条件。
    4. 单击“立即创建”,等待创建告警规则成功。


本站部分内容转载于网络,版权归原作者所有,转载之目的在于传播更多优秀技术内容,如有侵权请联系QQ/微信:153890879删除,谢谢!
上一篇:即时通信 IM 会话(Android) - SDK 文档 下一篇:没有了

推荐图文

  • 周排行
  • 月排行
  • 总排行

随机推荐