metrics icon indicating copy to clipboard operation
metrics copied to clipboard

opentsdb是单机统计,服务集群监控怎么看?

Open useraddZYB opened this issue 5 years ago • 3 comments

以耗时为例,p99等都是单机定时计算,然后上报出去,那么服务集群的p99怎么算?怎么算都不准吧

useraddZYB avatar Jun 28 '19 10:06 useraddZYB

We use Cluster Histogram. See https://github.com/alibaba/metrics/wiki/quick-start#clusterhistogram%E9%9B%86%E7%BE%A4%E5%88%86%E4%BD%8D%E6%95%B0

ralf0131 avatar Jun 30 '19 13:06 ralf0131

额。。。实话没怎么看懂。不过有这个考虑就行。也就是说默认的api都是针对单机的监控,如果需要集群服务粒度的,就得换一套集群的api。另外,再问个问题,定时上报那块一般设置period是多少秒?官方建议

public void start(long period, TimeUnit unit)

useraddZYB avatar Jul 01 '19 03:07 useraddZYB

这个根据你的指标的重要程度来区分的,阿里内部的主要还是走拉的方式。https://github.com/alibaba/metrics/wiki/naming-convention#metric%E7%9A%84%E7%AD%89%E7%BA%A7

ralf0131 avatar Jul 01 '19 09:07 ralf0131