prometheus 告警处理 – 运行 Alertmanger
先把mysql 搞定, prometheus监控MySQL环境 :连接
因为下边我们来测试 报警 mysql 的监控。
1-下载
https://prometheus.io/download/#alertmanager
wget https://github.com/prometheus/alertmanager/releases/download/v0.26.0/alertmanager-0.26.0.linux-amd64.tar.gz
2. 解压
3-运行
/opt/alertmanager-0.26.0.linux-amd64/alertmanager --config.file /opt/alertmanager-0.26.0.linux-amd64/alertmanager.yml
http://10.0.0.205:9093/#/status
配置邮箱:
cat /opt/alertmanager-0.26.0.linux-amd64/alertmanager.yml
上边对 altermanager的配配置就算完成了。
3.prometheus配置alermanager作为告警媒介
vim prometheus.yml
# Alertmanager configuration
alerting:
alertmanagers:
- static_configs:
- targets: ['10.0.0.205:9093']
# Load rules once and periodically evaluate them according to the global 'evaluation_interval'.
rule_files:
# - "first_rules.yml"
- "/app/prometheus/rules/*_rules.yml"
2 修改告警规则
建议用 mysql 的做测试:
groups:
- name: baimeidashu-container-runtime
rules:
- alert: mysql 挂掉啦
expr: up{instance="10.0.0.205:9104", job="mysql-exporter"} == 0
for: 15s
labels:
status: 严重告警
annotations:
summary: "{{ .instance }} 已停止运行超过 15s!"
- alert: container-32节点的联邦模式挂掉啦
expr: up{instance="10.0.0.205:9090", job="prometheus-federate-32"} == 0
for: 15s
labels:
status: 严重告警
annotations:
summary: "{{ .instance }} 联邦模式已停止运行超过 15s!"
3 重新加载prometheus的配置
这里要重启。
如果 altermanager 没有报警,
先检查 prometheus 的日志是否有配置对,如果没有错误输出,说明 prometheus 连接 altermanager 没有问题。
欢迎来撩 : 汇总all