H1ve icon indicating copy to clipboard operation
H1ve copied to clipboard

举办200人左右的比赛平台异常缓慢等问题

Open xiexiaoxin01 opened this issue 3 years ago • 1 comments

New Issue Checklist (自检清单)

  • [Y] Updated H1ve to the latest version (是否更新到最新版本)
  • [ Y] I have read the README
  • [ Y] I searched for existing GitHub issues

Issue Description (问题描述)

使用Hive平台举办了公司内部的CTF线上赛(解题赛),采用docker single部署方式,分配了12C 100G的虚机,60多支队伍,200人左右同时比赛,出现很多问题,主要有如下几个,不知是什么原因。 1、Redis连接数无法释放,超过最大值后报502错误(设置了timeout和增加最大连接数也无法缓解,最后写脚本定期清理连接数才有所缓解)。 2、平台在5到8分钟后会突然开始异常缓慢,页面需要数分钟才能打开,强行重启hive主进程有所缓解,但是重启5到8分钟后又开始异常缓慢(但是此时查看宿主机的cpu内存等各项参数都正常)。 3、动态容器的题目小部分队伍(不到10支)开启成功后,后续的队伍开启时报ipv4的错误。 4、平台自动运行一段时间(可能是几天,也可能是几小时),莫名其妙崩溃无法访问。 5、平台报502错误后,强行重启服务器(重启系统)一定概率强制进入setup页面,之后重启3到4次后回复正常。

Version & Environment (系统/环境版本)

  • Docker version 19.03.12, build 48a66213fe
  • docker-compose version 1.26.2, build eefe0d31
  • Os Version Ubuntu 19.10
  • Browser Version Google Chrome 版本 87.0.4280.88(正式版本) (64 位)

xiexiaoxin01 avatar Dec 17 '20 12:12 xiexiaoxin01

  1. 目前最优解就是定期清理连接
  2. 尝试将single.yml里的- WORKERS=1数量看情况将并发调大
  3. 需要提供具体报错才能定位问题
  4. 需要提供具体报错才能定位问题
  5. 502大部分都是由于redis连接数满了导致的,如果是在设置过程中出现的话,可以考虑将操作放慢重试

0akarma avatar Dec 18 '20 14:12 0akarma