当前位置：主页 > 查看内容

必须配置的监控告警_分布式消息服务 Kafka_用户指南_监控

发布时间：2021-10-17 00:00| 有位朋友查看

简介：本章节主要介绍部分监控指标的告警策略，以及配置操作。在实际业务中，建议按照以下告警策略，配置监控指标的告警规则。是否接近性能上限，表示当前资源支撑的性能为告警策略中设置的告警阈值，如果继续上升，业务可能出现问题。表1 Kafka实例配置告警的……

本章节主要介绍部分监控指标的告警策略，以及配置操作。在实际业务中，建议按照以下告警策略，配置监控指标的告警规则。

是否接近性能上限，表示当前资源支撑的性能为告警策略中设置的告警阈值，如果继续上升，业务可能出现问题。

表1 Kafka实例配置告警的指标
指标名称	正常范围	告警策略	是否接近性能上限	指标说明和告警处理建议
磁盘容量使用率	0~100	告警阈值：原始值>85 连续触发次数：3 告警级别：紧急	是	指标说明：该指标为从Kafka节点虚拟机层面采集的磁盘容量使用率。单位：%。处理建议：出现该告警时，需要修改实例存储空间，具体操作，请参考变更实例规格。
CPU核均负载	0~2	告警阈值：原始值>1.5 连续触发次数：3 告警级别：重要	是	指标说明：该指标为从Kafka节点虚拟机层面采集的CPU每个核的平均负载。处理建议：出现该告警时，需要修改实例基准带宽，即扩节点。具体操作，请参考变更实例规格。
内存使用率	0~100	告警阈值：原始值>85 连续触发次数：3 告警级别：紧急	是	指标说明：该指标为Kafka节点虚拟机层面采集的内存使用率。单位：%。处理建议：出现该告警时，需要修改实例基准带宽，即扩节点。具体操作，请参考变更实例规格。
Kafka进程JVM堆内存使用率	0~100	告警阈值：原始值>85 连续触发次数：3 告警级别：紧急	是	指标说明：该指标从Kafka节点Kafka进程JVM中采集的堆内存使用率。单位：%。处理建议：出现该告警时，需要修改实例基准带宽，即扩节点。具体操作，请参考变更实例规格。

父主题： 监控

本站部分内容转载于网络，版权归原作者所有，转载之目的在于传播更多优秀技术内容，如有侵权请联系QQ/微信：153890879删除，谢谢！

上一篇：即时通信 IM 会话（Android） - SDK 文档 下一篇：没有了

推荐图文