日志服务提供服务日志功能,用于记录操作日志、消费组延迟日志、Logtail告警日志、Logtail采集日志和Logtail状态日志,帮助您实时掌握日志服务的使用状况,提高运维效率。
前提条件
监控Logtail心跳
安装Logtail后,日志服务将Logtail状态日志保存在名为internal-diagnostic_log的Logstore中,您可以通过Logtail状态日志,检查Logtail的工作状态。
__topic__: logtail_status
查询语句,即可查询Logtail状态日志,具体操作步骤请参见查询分析日志。例如执行如下语句查询Logtail状态日志及统计最近一段时间内心跳正常的机器个数,并配置告警。如果查询分析结果低于Logtail所绑定的机器组中的总机器数则触发告警。
- 查询语句
__topic__: logtail_status | SELECT COUNT(DISTINCT ip) as ip_count
- 配置告警规则(此处假设总机器数为100)
如果产生告警,您可以在日志服务控制台上查看机器组状态,排查心跳异常的机器。
查看消费组延时
在日志服务中,除了查询分析日志外,还可以通过消费组对日志进行消费,详情请参见通过消费组消费日志数据。
在使用消费组消费时,日志服务将消费延时日志保存在名为internal-diagnostic_log的Logstore中。您可以通过消费延时日志了解当前的消费进度,当延时较大时,可以及时调整消费者个数等方式来改进消费速度。
__topic__: consumergroup_log
查询语句,即可查询消费组延时日志,具体操作步骤请参见查询分析日志。例如执行如下语句,查询test-consumer-group这个消费组的消费延时情况。__topic__: consumergroup_log and consumer_group: test-consumer-group | SELECT max_by(fallbehind, __time__) as fallbehind
监控Logtail异常情况
安装Logtail后,日志服务将Logtail告警日志保存在名为internal-diagnostic_log的Logstore中,您可以通过Logtail告警日志,及时发现Logtail异常状况,调整Logtail配置,确保日志不丢失。
__topic__: logtail_alarm
查询语句,即可查询Logtail告警日志,具体操作步骤请参见查询分析日志。例如执行如下语句,查询分析15分钟内各种异常类型发生的次数。__topic__: logtail_alarm | select sum(alarm_count)as errorCount, alarm_type GROUP BY alarm_type
操作审计
类型 | 字段 |
---|---|
主账户 |
|
RAM用户 |
|
Sts |
|