xuchuan-666
xuchuan-666
> 请问是怎么确定这些数据是“误报”的?这些调用根本不存在还是存在调用但没有发生“建连失败”? 这些调用存在,但是没有发生“建联失败”的情况,我们服务的调用及日志都没有任何的异常,但是通过kindling采集出来的数据,却时不时的会有显示tcp建联失败
我们应用的场景也比较简单,无论是集群服务之间的调用,还是集群服务与集群外部中间件之间的调用,都会不定时的会显示tcp建连失败的数据,但是我们排查了业务的日志,发现根本没有任何的错误输出,并且不只一个业务会出现这种问题,所以怀疑采集出来的数据有问题
[2.txt](https://github.com/KindlingProject/kindling/files/12102887/2.txt)  
在采集的数据中kindling_tcp_connect_total{errno="-2",success="false"},errno的value为-2,这个报错会在UnixSocketDomain类型下发生,应该把socket类型是AF_UNIX的过滤掉,这类不算TCP
配置文件networkanalyzer.url_clustering_method改成blank,来降低指标数量后观察一天,agent服务内存还是一直上涨,并oom 