Yukino

Results 215 comments of Yukino

> 这个功能启动开发了吗?我这个周末可以参与到这个功能的开发中来 没有。 这个功能比较复杂,引入队列后需要额外考虑很多东西,因此方案需要好好设计,目前暂时搁置这个 feature。

@18846837414 可以先按 echo 说的,dump 下 server 的线程栈,然后看看卡在哪里。 从你给出的堆栈看,timeout 是从上报执行状态这边发出的。而 server 处理结果其实只是做了写 DB 操作,所以大概率可能是触发了 DB 的性能瓶颈,你可以看下 DB 相关的监控确认下。有问题可以再反馈。 @Echo009 目前感觉 PowerJob 的监控还是比较弱(好吧,其实是0),后面找时间可以一起聊一个监控方案,至少做到系统自身的核心 API 的日志埋点,比如核心方法的平均 rt、调度的平均延迟、调度量等等,然后给出一个简单的日志、监控采集和部署方案(比如 ELK)

@18846837414 还有目前初步怀疑可能是接入的用户中存在大量上报 omsLogger 日志导致 server 端被打爆的情况,这块也可以线程 dump 看看,server 的瓶颈卡在哪里

很不错👍

好的,后续版本会支持该功能。

类似需求合并:https://github.com/PowerJob/PowerJob/issues/290

有这个打算,引入 “控制节点”。 不过这一块需要好好设计,目前还没有明确的排期和开发计划。