greenplum_exporter icon indicating copy to clipboard operation
greenplum_exporter copied to clipboard

Greenplum(v5,v6) exporter for Prometheus

Results 11 greenplum_exporter issues
Sort by recently updated
recently updated
newest added

采用二进制nohup的启动方式,但是进程经常性莫名挂掉。 ![image](https://github.com/tangyibo/greenplum_exporter/assets/24616188/b267b0be-7fa6-4746-a4db-ed1b672e60e7)

![image](https://user-images.githubusercontent.com/24616188/221497668-9ff6cf97-4074-4adc-a867-3efd4ef9ad2a.png) 这俩指标没加吗?我拉取最新代码编译的,监控gp5.x集群。没有这俩指标,以--log.level=info启动查看日志也没有指标对应的数据库查询。请问是bug还是不支持gp5.x。谢谢

Dashboard Grafana Dashboard ID: 13822 Grafana Dashboard URL: https://grafana.com/grafana/dashboards/13822 ![image](https://user-images.githubusercontent.com/28920732/219532037-b380834c-b2ec-4bd9-be71-ebf2e1bbad83.png)

time="2022-03-17T03:56:10Z" level=error msg="get metrics for scraper, error:sql: Scan error on column index 6, name \"state\": converting NULL to string is unsupported" source="locks.go:122" time="2022-03-17T03:56:10Z" level=error msg="get metrics for scraper:locks_scraper failed, error:sql:...

相关SQL需要获取表锁,所以往往会被一些查询操作所阻塞。 而膨胀的表,通过Grafana直连Greenplum数据库的方式实时获取即可,如果执行太高频,感觉没啥意义。

一个 IP 上可以跑很多任务,每个任务都算作一个客户端,客户端连接统计的时候最少应该按照 client_addr + application_name 来定义一个客户端。如果单纯以 IP 作为客户端的标示,有点... 比如: Flink / Spark

判断是否是因为资源队列已满,而造成SQL大面积阻塞. ```sql SELECT * FROM gp_toolkit.gp_resqueue_status; ```

希望新增如下指标项: - TPS,建议将已有的“事务提交率”指标拆成两个指标 - 当前最长事务的持续时间,即`MAX(EXTRACT(EPOCH FROM now() - xact_start))::float AS max_tx_duration`

现在的 Dashboard 强制约束了 Prometheus 数据源的名称,这个在导入时不太友好,还请加个变量通用化一点。