Takin icon indicating copy to clipboard operation
Takin copied to clipboard

系统运行一段时间后 服务器会出现大量的 CLOSE_WAIT 请求 导致系统无法访问 单独只重启 takin-web应用之后系统访问就正常了

Open Fyuxuan opened this issue 3 years ago • 8 comments

如标题,怀疑 takin-web 是不是有什么bug会导致,服务器出现大量的 CLOSE_WAIT请求,我在服务器上跑了个定时任务每隔十秒刷一次服务器连接情况记录到文件里,发现一到每天的凌晨1点开始之后,服务器就会出现大量的 CLOSE_WAIT 请求,一直往上增加,直到 takin-web 崩溃无法访问(但是我发现 takin-web的job还在正常运行,日志也一直在输出,就是接口请求进不去了),这些请求也没有关闭。

脚本如下:

echo "" >>  /softwares/close_wati.log
date +'%Y/%m/%d %H:%M:%S' >> /softwares/close_wati.log

netstat -n | awk '/^tcp/ {++S[$NF]} END {for(a in S) print a, S[a]}' >>  /softwares/close_wati.log

日志文件如下

close_wati.log

Fyuxuan avatar Dec 03 '21 02:12 Fyuxuan

takin-web 应用的运行日志 takin-web.zip

Fyuxuan avatar Dec 06 '21 02:12 Fyuxuan

正在解决中

Hezhongqi avatar Dec 06 '21 07:12 Hezhongqi

image

Hezhongqi avatar Dec 06 '21 07:12 Hezhongqi

druid连接数配置未生效,导致系统只能获取到默认的8个连接数据数,并且每个定时任务,都会将事件入库,正常业务就拿不到连接了

Hezhongqi avatar Dec 06 '21 07:12 Hezhongqi

image

Hezhongqi avatar Dec 06 '21 07:12 Hezhongqi

同时去除了elastic-job的事件监听功能,2.*版本的elastic-job都会存在事件插入报主键重复问题

Hezhongqi avatar Dec 06 '21 07:12 Hezhongqi

重新拉取下main分支,打包发布下

Hezhongqi avatar Dec 06 '21 07:12 Hezhongqi

@Hezhongqi 好的 我试下

Fyuxuan avatar Dec 06 '21 08:12 Fyuxuan