PrometheusAlert
PrometheusAlert copied to clipboard
Prometheus Alert是开源的运维告警中心消息转发系统,支持主流的监控系统Prometheus,Zabbix,日志系统Graylog和数据可视化系统Grafana发出的预警消息,支持钉钉,微信,华为云短信,腾讯云短信,腾讯云电话,阿里云短信,阿里...
**这个网站有很多Prometheus告警规则样例**: ``` # centos6和7的内存空闲量计算 node_memory_MemAvailable_bytes or (node_memory_Buffers_bytes + node_memory_Cached_bytes + node_memory_MemFree_bytes + node_memory_Slab_bytes) ``` 一个prometheus rules的示例,`level`用作区分告警方式,`level`, `kind`用作告警抑制方式。 ```yaml groups: - name: node-cpu rules: # cpu核数 - record: instance:node_cpus:count expr: count...
能否这次告警发送到聊天软件slack
建议上线静默功能
迫切需要Silences功能
两个需求
1. 需求一: 希望增加告警接收目标为Jira的工单(考虑到目前大型企业使用 Jira 作为报警工单记录) 2. 需求二: 希望增加 阿里云的 **事件监控**
比如app.conf配置了邮件标题,那所有的发邮件都只能使用这一个标题,在微信群里提了,让我提一个issues, 有必要的话 请加一个改标题的功能
对项目的一些建议
1. 这个项目可以作为告警事件接收总线,那么势必对告警事件的存储有一定的要求。使用MySQL类固定字段的存储方式显得不够灵活,比如lables 里面可能有一些自定义的字段也需要存储。建议能不能使用MongoDB 等存储方式,这样可以完整存储json。 2. 这个项目作为告警总站,可能对告警发送记录也需要存储,避免扯皮(某些人说通知没发给我)。
需要修改 https://github.com/feiyu563/PrometheusAlert/blob/master/controllers/feishu.go#L127 为 ```go emailtext+="" ``` 以及修改前台提示,让用户填入 open_id。我已经实测通过。
建议在自定义时间中,加入告警恢复时,该告警的持续时间
能否考虑支持生产告警事件统计报表,方便运维人员查看统计