Prometheus Alertmanager 安装与应用

九五霸霸 4月前 163

1、安装与启动 Alertmanager

下载地址:https://prometheus.io/download/

# wget https://github.com/prometheus/alertmanager/releases/download/v0.18.0/alertmanager-0.18.0.linux-amd64.tar.gz
# tar -xvf alertmanager-0.18.0.linux-amd64.tar.gz
# mv alertmanager-0.18.0.linux-amd64 /usr/local/alertmanager018
# /usr/local/alertmanager018/alertmanager --version
alertmanager, version 0.18.0 (branch: HEAD, revision: 1ace0f76b7101cccc149d7298022df36039858ca)
  build user:       root@868685ed3ed0
  build date:       20190708-14:31:49
  go version:       go1.12.6

为 alertmanager创建systemd服务管理配置

# vim /usr/lib/systemd/system/alertmanager.service
[Unit]
Description=Prometheus Alertmanager

[Service]
Type=simpleExecStart=/usr/local/alertmanager018/alertmanager  --log.level=info \
                                                   --storage.path=/data1/alertmanagerDATA/ \
                                                   --config.file=/usr/local/alertmanager018/alertmanager.yml
ExecReload=/bin/kill -s SIGHUP $MAINPID
[Install]
WantedBy=multi-user.target

启动 alertmanager 服务。

mkdir -p /data1/alertmanagerDATA
systemctl start alertmanager
systemctl status alertmanager

从浏览器打开验证测试:http://10.x.11.97:9093

2、多节点 Alertmanager HA 部署

Alertmanager 支持配置创建 HA 集群,通过使用 --cluster-* 标记来配置。

最简单的操作是只需在 alertmanager 启动时加上 --cluster.peer 标记,指向另一个 alertmanager 的 cluster 监听地址即可。

alertmanager-1:10.x.11.97 的启动配置:

[root@prom-11-97 ~]# cat /usr/lib/systemd/system/alertmanager.service
[Unit]
Description=Prometheus Alertmanager

[Service]
Type=simpleExecStart=/usr/local/alertmanager018/alertmanager  --log.level=info \
                                                   --storage.path=/data1/alertmanagerDATA/ \
                                                   --config.file=/usr/local/alertmanager018/alertmanager.yml \
                                                   --cluster.peer=10.x.216.238:9094
ExecReload=/bin/kill -s SIGHUP $MAINPID
[Install]
WantedBy=multi-user.target

alertmanager-2:10.x.216.238 的启动配置:

[root@prom-216-238 ~]# cat /usr/lib/systemd/system/alertmanager.service
[Unit]
Description=Prometheus Alertmanager

[Service]
Type=simpleExecStart=/usr/local/alertmanager018/alertmanager  --log.level=info \
                                                   --storage.path=/data1/alertmanagerDATA/ \
                                                   --config.file=/usr/local/alertmanager018/alertmanager.yml \
                                                   --cluster.peer=10.x.11.97:9094
ExecReload=/bin/kill -s SIGHUP $MAINPID
[Install]
WantedBy=multi-user.target

重启 Alertmanager 服务即可。访问 10.x.11.97:9093 或 10.x.216.238:9093 的webUI,可以在 Cluster Status 查看集群信息。

其它细节和参数,请参考:


最新回复 (0)
    • 运维开源项目互助社区—致敬开源
      2
        立即登录 立即注册 
返回