nps
nps copied to clipboard

Published 20 hours ago •

Reame
Issues

运行一段时间后nps cpu占满

Open xxxsen opened this issue 5 years ago • 20 comments

Describe the bug docker版本的nps在运行一段时间后, cpu占满了。

To Reproduce 暂时复现不了, docker重启后服务恢复正常

Expected behavior

Screenshots or logs

日志的话, 截取了出问题当天的，时间要往后加8个钟。文件地址

Server (please complete the following information):

OS: ubuntu:18.04
ARCH: amd64
Tunnel tcp
Version 0.26.0

Client (please complete the following information):

OS: debian:10
ARCH: amd64
Tunnel tcp
Version 0.26.0

Additional context

Jan 29 '20 14:01 xxxsen

只能看到断线情况存在，cpu的确实没看出来。。。。

Jan 29 '20 17:01 ffdfgdfg

应该是触发了什么隐藏bug，导致某个协程死循环了。能否代码里面加下pprof起个调试端口，然后打个镜像，这样下次再出问题的时候也能调下。。

On Thu, Jan 30, 2020, 01:20 ffdfgdfg [email protected] wrote:

只能看到断线情况存在，cpu的确实没看出来。。。。

— You are receiving this because you authored the thread. Reply to this email directly, view it on GitHub https://github.com/ehang-io/nps/issues/382?email_source=notifications&email_token=AA5TKVAGP6VUPTJOV3MUS6DRAG3HJA5CNFSM4KNFSTMKYY3PNVWWK3TUL52HS4DFVREXG43VMVBW63LNMVXHJKTDN5WW2ZLOORPWSZGOEKIAYVQ#issuecomment-579865686, or unsubscribe https://github.com/notifications/unsubscribe-auth/AA5TKVAMWK3ZUH4SU7K7PF3RAG3HJANCNFSM4KNFSTMA .

Jan 29 '20 17:01 xxxsen

ci自动构建的，开关代码感觉还是不好，确实还是有必要弄个debug模式多收集点信息，目前很难复现和排查

Jan 29 '20 17:01 ffdfgdfg

我自己打个带debug端口的镜像先跑着, 后面复现了再看看。

Jan 30 '20 04:01 xxxsen

好的，感谢反馈了

Jan 30 '20 05:01 ffdfgdfg

遇到了同样的问题，docker运行nps cpu 频繁被拉满，版本0.26.4，在线客户端不超过10个

Mar 06 '20 16:03 yisier

遇到了同样的问题，docker运行nps cpu 频繁被拉满，版本0.26.4，在线客户端不超过10个

这叫什么拉满，拉满该一直100%。第一这才60%，第二这并不是一直，有负载得时候 cpu上升再正常不过了

Mar 06 '20 18:03 cnlh

遇到了同样的问题，docker运行nps cpu 频繁被拉满，版本0.26.4，在线客户端不超过10个

这叫什么拉满，拉满该一直100%。第一这才60%，第二这并不是一直，有负载得时候 cpu上升再正常不过了

如果只有10几个客户端在用的话，这cpu负载也太不正常了，没有用docker之前cpu使用率最高不超过10%

Mar 07 '20 06:03 yisier

docker 就是一个空镜像放了个二进制文件，没有什么区别，cpu这个还是得用pprof跟踪才能看出问题

Mar 07 '20 14:03 ffdfgdfg

我也碰到类似问题，试了两个一个是直接 docker go run ... 过了一段时间2核的VPScpu跑满，非常缓慢地响应，无法登录管理后台。一个是docker run binary，刚刚发现掉速并且cpu占用维持在50%左右，可以登录管理后台。

May 18 '20 04:05 ryc111

arm版的客户端在docker和二进制运行上都遇到了这个问题，一般是运行三四天之后，吃满cpu。

Oct 12 '21 15:10 hnewcity

arm版的客户端在docker和二进制运行上都遇到了这个问题，一般是运行三四天之后，吃满cpu。

一样的问题 arm版本运行直接吃满CPU 卡的爆炸

Nov 18 '21 14:11 rsd1987

一样的问题

Nov 19 '21 00:11 xcodebin

arm版的客户端在docker和二进制运行上都遇到了这个问题，一般是运行三四天之后，吃满cpu。

我也遇到了，arm架构，运行3天后发现CPU高达占用80%，一查发现是npc服务

Nov 21 '21 11:11 wzbooks

我的npc也是cpu非常的高版本是0.26.10 之前是0.26.6也是非常高

Nov 23 '21 14:11 guochen2

这个之前有简单测试了下, 在客户端网络非常差的情况下出现的概率很高, 不过后续没有再关注了, 作者可以往这方面测试验证下, 大概率是链接出错后出现死循环了。

Nov 23 '21 14:11 xxxsen

赞同，不希望这么好的工具有这样的致命bug，还曾经捐助过。出现3次了

Dec 16 '21 10:12 xjiahong

2022 年了，bug 还在，哭了。bug 实在找不到能不能先加个自动检测功能，如果监测到当前进程占用 cpu 达到 100% 则直接自动重启，至少这样能先解决问题。不然我从公网连上去又不能手动关了重启，手动关了我就连不上了。

Feb 07 '22 14:02 yuanzhixiang

我的npc也出现这样的问题

May 07 '22 02:05 wq163

怀疑是域名解析的bug，在服务端后台停掉后，客户端npc的cpu占用马上降下来了，再次开启还没复现bug

May 07 '22 04:05 wq163