nps
nps copied to clipboard
运行一段时间后nps cpu占满
Describe the bug docker版本的nps在运行一段时间后, cpu占满了。
To Reproduce 暂时复现不了, docker重启后服务恢复正常
Expected behavior
Screenshots or logs
日志的话, 截取了出问题当天的, 时间要往后加8个钟。文件地址
Server (please complete the following information):
- OS: ubuntu:18.04
- ARCH: amd64
- Tunnel tcp
- Version 0.26.0
Client (please complete the following information):
- OS: debian:10
- ARCH: amd64
- Tunnel tcp
- Version 0.26.0
Additional context
只能看到断线情况存在,cpu的确实没看出来。。。。
应该是触发了什么隐藏bug,导致某个协程死循环了。能否代码里面加下pprof起个调试端口,然后打个镜像,这样下次再出问题的时候也能调下。。
On Thu, Jan 30, 2020, 01:20 ffdfgdfg [email protected] wrote:
只能看到断线情况存在,cpu的确实没看出来。。。。
— You are receiving this because you authored the thread. Reply to this email directly, view it on GitHub https://github.com/ehang-io/nps/issues/382?email_source=notifications&email_token=AA5TKVAGP6VUPTJOV3MUS6DRAG3HJA5CNFSM4KNFSTMKYY3PNVWWK3TUL52HS4DFVREXG43VMVBW63LNMVXHJKTDN5WW2ZLOORPWSZGOEKIAYVQ#issuecomment-579865686, or unsubscribe https://github.com/notifications/unsubscribe-auth/AA5TKVAMWK3ZUH4SU7K7PF3RAG3HJANCNFSM4KNFSTMA .
ci自动构建的,开关代码感觉还是不好,确实还是有必要弄个debug模式多收集点信息,目前很难复现和排查
我自己打个带debug端口的镜像先跑着, 后面复现了再看看。
好的,感谢反馈了
遇到了同样的问题,docker运行nps cpu 频繁被拉满,版本0.26.4,在线客户端不超过10个
遇到了同样的问题,docker运行nps cpu 频繁被拉满,版本0.26.4,在线客户端不超过10个
这叫什么拉满,拉满该一直100%。第一这才60%,第二这并不是一直,有负载得时候 cpu上升再正常不过了
遇到了同样的问题,docker运行nps cpu 频繁被拉满,版本0.26.4,在线客户端不超过10个
这叫什么拉满,拉满该一直100%。第一这才60%,第二这并不是一直,有负载得时候 cpu上升再正常不过了
如果只有10几个客户端在用的话,这cpu负载也太不正常了,没有用docker之前cpu使用率最高不超过10%
docker 就是一个空镜像放了个二进制文件,没有什么区别,cpu这个还是得用pprof跟踪才能看出问题
我也碰到类似问题,试了两个一个是直接 docker go run ... 过了一段时间2核的VPScpu跑满,非常缓慢地响应,无法登录管理后台。 一个是docker run binary,刚刚发现掉速并且cpu占用维持在50%左右,可以登录管理后台。
arm版的客户端在docker和二进制运行上都遇到了这个问题,一般是运行三四天之后,吃满cpu。
arm版的客户端在docker和二进制运行上都遇到了这个问题,一般是运行三四天之后,吃满cpu。
一样的问题 arm版本运行 直接吃满CPU 卡的爆炸
一样的问题
arm版的客户端在docker和二进制运行上都遇到了这个问题,一般是运行三四天之后,吃满cpu。
我也遇到了,arm架构,运行3天后发现CPU高达占用80%,一查发现是npc服务
我的npc也是cpu非常的高 版本是0.26.10 之前是0.26.6也是非常高
这个之前有简单测试了下, 在客户端网络非常差的情况下出现的概率很高, 不过后续没有再关注了, 作者可以往这方面测试验证下, 大概率是链接出错后出现死循环了。
赞同,不希望这么好的工具有这样的致命bug,还曾经捐助过。出现3次了
2022 年了,bug 还在,哭了。bug 实在找不到能不能先加个自动检测功能,如果监测到当前进程占用 cpu 达到 100% 则直接自动重启,至少这样能先解决问题。不然我从公网连上去又不能手动关了重启,手动关了我就连不上了。
我的npc也出现这样的问题
怀疑是域名解析的bug,在服务端后台停掉后,客户端npc的cpu占用马上降下来了,再次开启还没复现bug