AdaLoGN icon indicating copy to clipboard operation
AdaLoGN copied to clipboard

您好,想问一下有关batchsize

Open 736015747 opened this issue 2 years ago • 5 comments

我不是很懂,因为课程原因想运行一下您的代码 在服务器上运行时好像单个显卡运行时显存不够(11G显存),想修改batch size,在shell里面将两个batch size都修改为了1还是跑不动。 用两块以上的显卡一起跑的时候会有RuntimeError: NCCL Error 2: unhandled system error报错,不知怎么解决,万分感谢!!

736015747 avatar Oct 29 '22 10:10 736015747

服务器的每块显卡都是RTX 2080,11G显存,batch size=1不知道能不能跑动,如果不能可以两块显卡一起跑吗

736015747 avatar Oct 29 '22 11:10 736015747

你好: 感谢对我们工作的关注! 显存至少需要24G,我们的实验在NVIDIA V100 (32GB)上运行的。抱歉11G显存可能无法运行。 我们会注意这方面的改进,会考虑发布需要更少计算资源的版本。 谢谢!

patronum08 avatar Oct 30 '22 08:10 patronum08

你好: 感谢对我们工作的关注! 显存至少需要24G,我们的实验在NVIDIA V100 (32GB)上运行的。抱歉11G显存可能无法运行。 我们会注意这方面的改进,会考虑发布需要更少计算资源的版本。 谢谢!

你好,那请问可以两块以上显卡一起跑吗,谢谢解答!

736015747 avatar Oct 30 '22 11:10 736015747

你好: 目前我们还没实现这个😂,抱歉。 谢谢!

patronum08 avatar Oct 30 '22 11:10 patronum08

你好: 目前我们还没实现这个😂,抱歉。 谢谢!

谢谢!

736015747 avatar Oct 30 '22 11:10 736015747