您的位置 首页 prometheus

prometheus 告警处理 – 运行 Alertmanger

prometheus 告警处理 – 运行 Alertmanger

先把mysql  搞定, prometheus监控MySQL环境 :连接 

因为下边我们来测试  报警 mysql 的监控。

1-下载

https://prometheus.io/download/#alertmanager

 

wget https://github.com/prometheus/alertmanager/releases/download/v0.26.0/alertmanager-0.26.0.linux-amd64.tar.gz

 

2. 解压

3-运行

/opt/alertmanager-0.26.0.linux-amd64/alertmanager --config.file /opt/alertmanager-0.26.0.linux-amd64/alertmanager.yml

http://10.0.0.205:9093/#/status

配置邮箱:

cat /opt/alertmanager-0.26.0.linux-amd64/alertmanager.yml

alertmanager.yml (保密)

上边对 altermanager的配配置就算完成了。

3.prometheus配置alermanager作为告警媒介

vim prometheus.yml

 

# Alertmanager configuration
alerting:
  alertmanagers:
    - static_configs:
        - targets: ['10.0.0.205:9093']
       

# Load rules once and periodically evaluate them according to the global 'evaluation_interval'.
rule_files:
  # - "first_rules.yml"
   - "/app/prometheus/rules/*_rules.yml"

 

2 修改告警规则

建议用 mysql 的做测试:

 

groups:
- name: baimeidashu-container-runtime
  rules:
  - alert: mysql 挂掉啦
    expr: up{instance="10.0.0.205:9104", job="mysql-exporter"} == 0
    for: 15s
    labels:
      status: 严重告警
    annotations:
      summary: "{{ .instance }} 已停止运行超过 15s!"
  - alert: container-32节点的联邦模式挂掉啦
    expr: up{instance="10.0.0.205:9090", job="prometheus-federate-32"} == 0
    for: 15s
    labels:
      status: 严重告警
    annotations:
      summary: "{{ .instance }} 联邦模式已停止运行超过 15s!"

 

 

 

3 重新加载prometheus的配置

这里要重启。

 

 

如果 altermanager  没有报警,

先检查 prometheus 的日志是否有配置对,如果没有错误输出,说明 prometheus 连接 altermanager 没有问题。

 

 

 

欢迎来撩 : 汇总all

白眉大叔

关于白眉大叔linux云计算: 白眉大叔

热门文章