nps icon indicating copy to clipboard operation
nps copied to clipboard

运行一段时间后nps cpu占满

Open xxxsen opened this issue 5 years ago • 20 comments

Describe the bug docker版本的nps在运行一段时间后, cpu占满了。

To Reproduce 暂时复现不了, docker重启后服务恢复正常

Expected behavior

Screenshots or logs

image

image

日志的话, 截取了出问题当天的, 时间要往后加8个钟。文件地址

Server (please complete the following information):

  • OS: ubuntu:18.04
  • ARCH: amd64
  • Tunnel tcp
  • Version 0.26.0

Client (please complete the following information):

  • OS: debian:10
  • ARCH: amd64
  • Tunnel tcp
  • Version 0.26.0

Additional context

xxxsen avatar Jan 29 '20 14:01 xxxsen

只能看到断线情况存在,cpu的确实没看出来。。。。

ffdfgdfg avatar Jan 29 '20 17:01 ffdfgdfg

应该是触发了什么隐藏bug,导致某个协程死循环了。能否代码里面加下pprof起个调试端口,然后打个镜像,这样下次再出问题的时候也能调下。。

On Thu, Jan 30, 2020, 01:20 ffdfgdfg [email protected] wrote:

只能看到断线情况存在,cpu的确实没看出来。。。。

— You are receiving this because you authored the thread. Reply to this email directly, view it on GitHub https://github.com/ehang-io/nps/issues/382?email_source=notifications&email_token=AA5TKVAGP6VUPTJOV3MUS6DRAG3HJA5CNFSM4KNFSTMKYY3PNVWWK3TUL52HS4DFVREXG43VMVBW63LNMVXHJKTDN5WW2ZLOORPWSZGOEKIAYVQ#issuecomment-579865686, or unsubscribe https://github.com/notifications/unsubscribe-auth/AA5TKVAMWK3ZUH4SU7K7PF3RAG3HJANCNFSM4KNFSTMA .

xxxsen avatar Jan 29 '20 17:01 xxxsen

ci自动构建的,开关代码感觉还是不好,确实还是有必要弄个debug模式多收集点信息,目前很难复现和排查

ffdfgdfg avatar Jan 29 '20 17:01 ffdfgdfg

我自己打个带debug端口的镜像先跑着, 后面复现了再看看。

xxxsen avatar Jan 30 '20 04:01 xxxsen

好的,感谢反馈了

ffdfgdfg avatar Jan 30 '20 05:01 ffdfgdfg

image 遇到了同样的问题,docker运行nps cpu 频繁被拉满,版本0.26.4,在线客户端不超过10个

yisier avatar Mar 06 '20 16:03 yisier

image 遇到了同样的问题,docker运行nps cpu 频繁被拉满,版本0.26.4,在线客户端不超过10个

这叫什么拉满,拉满该一直100%。第一这才60%,第二这并不是一直,有负载得时候 cpu上升再正常不过了

cnlh avatar Mar 06 '20 18:03 cnlh

image 遇到了同样的问题,docker运行nps cpu 频繁被拉满,版本0.26.4,在线客户端不超过10个

这叫什么拉满,拉满该一直100%。第一这才60%,第二这并不是一直,有负载得时候 cpu上升再正常不过了

image image

如果只有10几个客户端在用的话,这cpu负载也太不正常了,没有用docker之前cpu使用率最高不超过10%

yisier avatar Mar 07 '20 06:03 yisier

docker 就是一个空镜像放了个二进制文件,没有什么区别,cpu这个还是得用pprof跟踪才能看出问题

ffdfgdfg avatar Mar 07 '20 14:03 ffdfgdfg

我也碰到类似问题,试了两个一个是直接 docker go run ... 过了一段时间2核的VPScpu跑满,非常缓慢地响应,无法登录管理后台。 一个是docker run binary,刚刚发现掉速并且cpu占用维持在50%左右,可以登录管理后台。

ryc111 avatar May 18 '20 04:05 ryc111

arm版的客户端在docker和二进制运行上都遇到了这个问题,一般是运行三四天之后,吃满cpu。

hnewcity avatar Oct 12 '21 15:10 hnewcity

arm版的客户端在docker和二进制运行上都遇到了这个问题,一般是运行三四天之后,吃满cpu。

一样的问题 arm版本运行 直接吃满CPU 卡的爆炸

rsd1987 avatar Nov 18 '21 14:11 rsd1987

一样的问题

xcodebin avatar Nov 19 '21 00:11 xcodebin

arm版的客户端在docker和二进制运行上都遇到了这个问题,一般是运行三四天之后,吃满cpu。

我也遇到了,arm架构,运行3天后发现CPU高达占用80%,一查发现是npc服务

wzbooks avatar Nov 21 '21 11:11 wzbooks

image 我的npc也是cpu非常的高 版本是0.26.10 之前是0.26.6也是非常高

guochen2 avatar Nov 23 '21 14:11 guochen2

这个之前有简单测试了下, 在客户端网络非常差的情况下出现的概率很高, 不过后续没有再关注了, 作者可以往这方面测试验证下, 大概率是链接出错后出现死循环了。

xxxsen avatar Nov 23 '21 14:11 xxxsen

赞同,不希望这么好的工具有这样的致命bug,还曾经捐助过。出现3次了

xjiahong avatar Dec 16 '21 10:12 xjiahong

2022 年了,bug 还在,哭了。bug 实在找不到能不能先加个自动检测功能,如果监测到当前进程占用 cpu 达到 100% 则直接自动重启,至少这样能先解决问题。不然我从公网连上去又不能手动关了重启,手动关了我就连不上了。

yuanzhixiang avatar Feb 07 '22 14:02 yuanzhixiang

我的npc也出现这样的问题

wq163 avatar May 07 '22 02:05 wq163

怀疑是域名解析的bug,在服务端后台停掉后,客户端npc的cpu占用马上降下来了,再次开启还没复现bug

wq163 avatar May 07 '22 04:05 wq163