Alertmanager��ø��澯��

ԭ��

ȫ�ɳ��Աdemo

�� 2024-01-15 22:08:17

4050

�� 2024-01-15 22:08:17

�ٱ�

��±��¼��ר��ҵ��prometheus��Grafana��ҵ��prometheus��Grafana

Alertmanager��ø��澯��

�ڴ�֮ǰ,��׼��Ͱ�װ�ҾͲ��ظ�һ��.��Կ�֮ǰ�Ĳ��,��ֱ�Ӳ��.

Alertmanager��ø��

Alertmanager��Ҫ��Prometheus��ĸ澯��ͳһ��,��Alertmanager��һ��¼��Ҫ��:

ȫ��(global) : ��ڶ��һЩȫ�ֵĹ��,��ȫ�ֵ�SMTP��,Slack��õ��;
ģ��(templates) : ��ڶ��澯֪ͨʱ��ģ��,��HTMLģ��,�ʼ�ģ��;
�澯·��(route) : ��ݱ�ǩƥ��,ȷ��ǰ�澯Ӧ��δ��;
��(receivers) : ��һ��ĸ��,��һ��Ҳ��΢��,Slack��Webhook��,��һ��澯·��ʹ��;
��ƹ��(inhibit_rules) : ��ƹ��Լ��澯�Ĳ��

global:
  #163������
  smtp_smarthost: 'smtp.163.com:465'
  #���ʼ�������
  smtp_from: 'cdring@163.com'
  #���ʼ��������û�����Ҳ����������䡡��������
  smtp_auth_username: 'cdring@163.com'
  #���ʼ�����������
  smtp_auth_password: 'your-password'
  #����tls��֤
  smtp_require_tls: false

route:
  group_by: ['alertname']
  # ���յ��澯��ʱ�򣬵ȴ�group_wait���õ�ʱ�䣬���Ƿ��и澯������о�һ�𷢳�ȥ
  group_wait: 10s
  #  ����ϴθ澯��Ϣ���ͳɹ�����ʱ������һ���µĸ澯���ݣ�����Ҫ�ȴ�group_interval���õ�ʱ��ſ��Է��ͳ�ȥ
  group_interval: 10s
  # ����ϴθ澯��Ϣ���ͳɹ���������û�н������ȴ� repeat_interval���õ�ʱ���ٴη��͸澯����
  repeat_interval: 10m
  # ȫ�ֱ����飬��������Ǳ�ѡ��
  receiver: email

receivers:
- name: 'email'
  #���ʼ�������
  email_configs:
  - to: 'cdring@163.com'
inhibit_rules:
 - source_match:
     severity: 'critical'
   target_match:
     severity: 'warning'
   equal: ['alertname', 'dev', 'instance']

��ȫ��Ҫע��resolve_timeout,�ò��Alertmanager��೤ʱ��δ��յ��澯��Ǹ澯״̬Ϊresolved(�ѽ��).�ò��Ķ��ܻ�Ӱ�쵽�澯�ָ�֪ͨ�Ľ��ʱ��,��߿ɸ��Լ��ʵ�ʳ��ж��,��Ĭ��ֵΪ5��.�ڽ��Ĳ��,��ǽ��һЩʵ��ӽ��Alertmanager��.

Prometheus�澯��

Prometheus�еĸ澯��PromQL��ʽ��澯��,Prometheus��˶��Щ��Լ��,��1��㴥��ᴥ��澯֪ͨ.Ĭ��,�û��ͨ��Prometheus��Web��鿴��Щ�澯��Լ��澯�Ĵ��״̬.��Prometheus��Alertmanager��,��Խ��澯��͵��ⲿ��Զ��Щ�澯��н�һ��Ĵ��.

�澯��Prometheus��

��Alertmanager��

Prometheus�Ѳ��ĸ澯��͸�Alertmanager��и澯��ʱ,��Ҫ��Prometheusʹ�õ��ļ��ӹ��Alertmanager��Ķ�Ӧ��.

1.�༭Prometheus.yml�ļ��Alertmanager��ķ��ʵ�ַ,ʾ��:

# Alertmanager ����
alerting:
  alertmanagers:
  - static_configs:
    - targets: ['alertmanager:9093']

2.��Ӽ��Alertmanager,��Prometheusȥ�ֻ�Alertmanager�ļ��ָ��.

 - job_name: 'alertmanager'
    scrape_interval: 15s
    static_configs:
    - targets: ['alertmanager:9093']

��ø澯��ļ�

vim promtheus/alert.yml

�澯��:

groups:
- name: Prometheus alert
  rules:
  # ���κ�ʵ������30���޷���ϵ�������������
  - alert: ����澯
    expr: up == 0
    for: 30s
    labels:
      severity: critical
    annotations:
      summary: "�����쳣,ʵ��:{{ $labels.instance }}"
      description: "{{ $labels.job }} �����ѹر�"

�ڸ澯��ļ��,��ǿ��Խ�һ��صĹ��ö��group��.��ÿһ��group��ǿ��Զ��澯��(rule).һ��澯��Ҫ��¼��:

alert: �澯��
expr: ��PromQL��ʽ�澯��,��ڼ��Ƿ��ʱ��
for: ��ȴ�ʱ��,��ѡ��.��ڱ�ʾֻ�е�ǰ��һ��ʱ��ڷ��͸澯.�ڵȴ�ʱ��²��ĸ澯��״̬Ϊpending
labels: �Զ��ǩ,��û�ָ��Ҫ��ӵ��澯�ϵ�һ�鸽�ӱ�ǩ
annotations: ��ָ��һ�鸽��Ϣ,��澯��Ϣ��ֵ�,annotations��ڸ澯��ʱ��Ϊ��͵�Alertmanager

ָ��ظ澯��

Ϊ��ܹ��Prometheus�ܹ��ö��ĸ澯��,��Ҫ��Prometheusȫ��ļ��ͨ��rule_filesָ��һ��澯��ļ��ķ��·��,Prometheus��Զ�ɨ��Щ·��¹��ļ��ж��,��Ҹ��Щ��Ƿ��ⲿ��֪ͨ:

��

# ����(������)����
rule_files:
  - "alert.yml"
  - "rules/*.yml"

��¼��

curl -x POST http://localhost:9090/-/reload

�鿴�澯״̬

��Prometheus��,�û��ͨ��Prometheus WEB��Alerts�˵��鿴��ǰPrometheus�µ��и澯��,�Լ��ǰ��Ļ״̬.

ͬʱ��Լ�pending��firing�ĸ澯,PrometheusҲ�Ὣ��Ǵ洢��ʱ��ALERTS{}��.

��ͨ��ʽ,��ѯ�澯ʵ��:

AlERTS{}

��ֵΪ1��ʾ��ǰ�澯��ڻ״̬(pending��firing),��澯�ӻ״̬ת��Ϊ�ǻ״̬ʱ��ֵΪ0

��Ը澯��

��

docker stop node-exporter

Prometheus�״μ�⵽��㴥��,��ڸ澯��1��(for: 1m)�ĵȴ�ʱ��,�澯״̬��INACTIVE��ΪPending,��ͼ��ʾ:

��1��Ӻ�澯��,�澯ת̨��Pending��ΪFIRING,��һ�Ѹ澯��Ϣ��͸�Alertmanager.��ͼ��ʾ:

ԭ��ϵ��Ȩ��Ѷ�ƿ��δ��ɣ��ת�ء�

��Ȩ��ϵ cloudcommunity@tencent.com ɾ��

��ά

Prometheus ��ط��

prometheus

��

ԭ��ϵ��Ȩ��Ѷ�ƿ��δ��ɣ��ת�ء�

��Ȩ��ϵ cloudcommunity@tencent.com ɾ��

��¼��

0 ��

�ȶ�

��

Alertmanager��ø��澯��

Alertmanager��ø��澯��

Alertmanager��ø��澯��

Alertmanager��ø��

Prometheus�澯��

��Alertmanager��

��ø澯��ļ�

ָ��ظ澯��

�鿴�澯״̬

��Ը澯��

��

�

��Դ

��

��Ѷ�ƿ��

��Ų�Ʒ

��Ƽ�

��Ƽ�

Alertmanager���ø������澯����

Alertmanager���ø������澯����

Alertmanager���ø������澯����

Alertmanager���ø���

Prometheus�澯����

��Alertmanager����

���ø澯�����ļ�

ָ�����ظ澯����

�鿴�澯״̬

���Ը澯����

����

�

��Դ

����

��Ѷ�ƿ�����

���Ų�Ʒ

�����Ƽ�

�����Ƽ�

Alertmanager��ø��澯��

Alertmanager��ø��澯��

Alertmanager��ø��澯��

Alertmanager��ø��

Prometheus�澯��

��Alertmanager��

��ø澯��ļ�

ָ��ظ澯��

��Ը澯��

��

��

��Ѷ�ƿ��

��Ų�Ʒ

��Ƽ�

��Ƽ�