greenplum_exporter
greenplum_exporter copied to clipboard
Greenplum(v5,v6) exporter for Prometheus
采用二进制nohup的启动方式,但是进程经常性莫名挂掉。 
 这俩指标没加吗?我拉取最新代码编译的,监控gp5.x集群。没有这俩指标,以--log.level=info启动查看日志也没有指标对应的数据库查询。请问是bug还是不支持gp5.x。谢谢
Dashboard Grafana Dashboard ID: 13822 Grafana Dashboard URL: https://grafana.com/grafana/dashboards/13822 
time="2022-03-17T03:56:10Z" level=error msg="get metrics for scraper, error:sql: Scan error on column index 6, name \"state\": converting NULL to string is unsupported" source="locks.go:122" time="2022-03-17T03:56:10Z" level=error msg="get metrics for scraper:locks_scraper failed, error:sql:...
相关SQL需要获取表锁,所以往往会被一些查询操作所阻塞。 而膨胀的表,通过Grafana直连Greenplum数据库的方式实时获取即可,如果执行太高频,感觉没啥意义。
一个 IP 上可以跑很多任务,每个任务都算作一个客户端,客户端连接统计的时候最少应该按照 client_addr + application_name 来定义一个客户端。如果单纯以 IP 作为客户端的标示,有点... 比如: Flink / Spark
判断是否是因为资源队列已满,而造成SQL大面积阻塞. ```sql SELECT * FROM gp_toolkit.gp_resqueue_status; ```
希望新增如下指标项: - TPS,建议将已有的“事务提交率”指标拆成两个指标 - 当前最长事务的持续时间,即`MAX(EXTRACT(EPOCH FROM now() - xact_start))::float AS max_tx_duration`
现在的 Dashboard 强制约束了 Prometheus 数据源的名称,这个在导入时不太友好,还请加个变量通用化一点。