everiu

Results 15 comments of everiu

目前需要自己实现告警中心来执行真正的告警发送逻辑,Cat可以将告警内容推送到自己实现的告警中心,然后由告警中心发送 可以参考[告警服务端](https://github.com/dianping/cat/wiki/alarm#%E5%91%8A%E8%AD%A6%E6%9C%8D%E5%8A%A1%E7%AB%AF)文档,主要分为两步 1. 实现自己的告警中心,并暴露接口接收cat推送过来的告警内容 2. 更新cat的sender-config配置文件,配置告警接收地址和告警内容格式

netty 支持arm架构的原生epoll可以看下这个commit https://github.com/dianping/cat/commit/4684ba7bbbeffe071092e99333f28410d08f18ef 可以尝试master分支编译最新版本的包,看下是否可以在arm架构下部署

第一个报错信息 [ERROR] [AlertManager] test java.net.UnknownHostException: test 显示的是告警发送有问题,unknownhost,配置的告警发送链接是 test, 无法解析这个域名,因此报错,可以看下数据库中 config这张表的name=senderConfig这个配置,里面配置了告警应该发送的地址,Cat自身没有实现告警发送的功能,他目前是将告警的内容发送到类似独立的告警中心(实现了具体发送逻辑,认证等信息),由独立的告警中心来完成真正的告警发送功能

第二个报错信息看起来像是解码出了问题,好像是预期读取的字节数跟目前实际读取的字节数匹配不上,感觉是不是客户端上报数据有点问题

> > 第二个报错信息看起来像是解码出了问题,好像是预期读取的字节数跟目前实际读取的字节数匹配不上,感觉是不是客户端上报数据有点问题 > > 客户端的 pom依赖必须跟服务端一致吗,这里服务端用的是最新master编译的cat.war,springboot里面依赖还是以前3.0 3.1的client,有关系吗 应该是不需要的,都是3.x的版本,协议解析应该不影响,目前cat server自身上报的指标可以正常查看吗

> > > > 第二个报错信息看起来像是解码出了问题,好像是预期读取的字节数跟目前实际读取的字节数匹配不上,感觉是不是客户端上报数据有点问题 > > > > > > > > > 客户端的 pom依赖必须跟服务端一致吗,这里服务端用的是最新master编译的cat.war,springboot里面依赖还是以前3.0 3.1的client,有关系吗 > > > > > > 应该是不需要的,都是3.x的版本,协议解析应该不影响,目前cat server自身上报的指标可以正常查看吗 > > 会是因为 master分支里面 netty是4.0,cat-home里面的Pom文件里面是4.0的,springboot打的包里面用的是3.x的...

> > > netty 支持arm架构的原生epoll可以看下这个commit > > > [4684ba7](https://github.com/dianping/cat/commit/4684ba7bbbeffe071092e99333f28410d08f18ef) > > > 可以尝试master分支编译最新版本的包,看下是否可以在arm架构下部署 > > > > > > 大佬,新master分支,在arm服务器上跑起来了,2280端口映射了,服务器运行正常,cat WEB端功能使用正常,但是观察运行一会以后报了如下错误,还望解答.... > > [ERROR] [AlertManager] test java.net.UnknownHostException: test at java.net.AbstractPlainSocketImpl.connect(AbstractPlainSocketImpl.java:196)...

告警和处理消息的是两个独立的服务吗,处理消息的服务重启了,告警的服务正常运行吗?

理论上是不会的,从目前的代码来看,告警会从目前所有处理消息(Consumer)的节点获取告警规则对应的数据,如果有Consumer节点挂了,则此时告警规则不会被触发的 下面是EventAlert告警检测中的获取报表数据的代码,从请求参数(requireAll=true)来看,必须所有请求所有Consumer节点成功才会检测告警规则 https://github.com/dianping/cat/blob/master/cat-home/src/main/java/com/dianping/cat/report/alert/event/EventAlert.java#L203 因此感觉,是告警规则的数据在检测的时候的真实值就是0

在Heartbeat报表中客户看到cpu,内存等客户端上报的心跳信息