prometheus_practice
prometheus_practice copied to clipboard
包括 Prometheus 基础知识,性能优化和大量实战经验。
Prometheus 实战
v0.1.0
在过去一年左右时间里,我们使用 Prometheus 完成了对几个机房的基础和业务监控,大大提高了服务质量以及 oncall 水平,在此特别感谢 Promethues 这样优秀的开源软件。
当初选择 Prometheus 并不是偶然,因为:
-
Prometheus 是按照 Google SRE 运维之道的理念构建的,具有实用性和前瞻性。
-
Prometheus 社区非常活跃,基本稳定在 1个月1个版本的迭代速度,从 2016 年 v1.01 开始接触使用以来,到目前发布的 v1.8.2 以及最新最新的 v2.1 ,你会发现 Prometheus 一直在进步、在优化。
-
Go 语言开发,性能不错,安装部署简单,多平台部署兼容性好。
-
丰富的数据收集客户端,官方提供了各种常用 exporter。
-
丰富强大的查询能力。
Prometheus 作为监控后起之秀,虽然还有做的不够好的地方,但是不妨碍我们使用和喜爱它。根据我们长期的使用经验来看,它足以满足大多数场景需求,只不过对于新东西,往往需要花费更多力气才能发挥它的最大能力而已。
本书主要根据个人过去一年多的使用经验总结而成,内容主要包括 Prometheus 基本知识、进阶、实战以及常见问题列表等方面,希望对大家有所帮助。
本开源书籍既适用于具备基础 Linux 知识的运维初学者,也可供渴望理解 Prometheus 原理和实现细节的高级用户参考,同时也希望书中给出的实践案例在实际部署监控中对大家有所帮助。
你准备好了吗?接下来就让我们一起开始这段神奇旅行吧!
目录
- 前言
- 修订记录
- 如何贡献
-
Prometheus 简介
- Prometheus 是什么
- 为什么选择 Prometheus
-
Prometheus 安装
- 二进制包安装
- Docker 安装
-
基础概念
- 数据模型
- 指标类型
- 作业与实例
-
PromQL
- PromQL 基本使用
- 与 SQL 对比
-
数据可视化
- Web Console
- Grafana
-
Prometheus 配置
- 全局配置
- 告警配置
- 规则配置
- 数据拉取配置
- 远程可写存储
- 远程可读存储
- 服务发现
- 配置样例
-
服务发现
- 静态服务发现
- 文件服务发现
- HTTP服务发现
- Consul服务发现
- moby服务发现
- kubernetes服务发现
-
Exporter
- 文本格式
- Sample Exporter
- Node Exporter 安装使用
- Node Exporter 常用查询
- 其他 Exporter 介绍
-
Pushgateway
- Pushgateway 是什么
- 如何使用 Pushgateway
-
数据存储
- Local Store
- Remote Store
-
告警/记录规则
- 如何配置
- 触发逻辑
-
Alertmanager
- Alertmanager 是什么
- 配置详情
- 通过 Email 接收告警
- 通过企业微信接收告警
- 通过 Slack 接收告警
- 通过 Webhook 接收告警
- 其他告警接收方案
-
Prometheus 工具
- Promtool 介绍和使用
- Client SDK
-
Prometheus 性能调优
- Metrics 仪表盘
- 启动参数优化
- 日志查询
-
Prometheus 与容器
- Docker
- Kubernetes
-
高可用方案探讨
- Prometheus Server 的高可靠
- AlertManager 的高可靠
-
实战练习
- NodeExporter
- 配置告警规则
- Grafana 集成
- Alertmanager 告警
-
常见问题收录
- 如何热加载新配置
- 如何通过认证后拉取数据
技术交流
欢迎加入 Prometheus 技术交流微信群,分享 Prometheus 资源,交流 Prometheus 技术。
- 微信群: