Bert-Chinese-Text-Classification-Pytorch icon indicating copy to clipboard operation
Bert-Chinese-Text-Classification-Pytorch copied to clipboard

训练开始后进度条不动

Open Yukimini opened this issue 3 years ago • 7 comments

如图,在开始train之后,我的进度一直停留在Epoch[1/3]不懂,不知道是什么原因。目前用3090Ti在训练,应该不会这么慢。请问有大佬知道原因吗?? image

Yukimini avatar Dec 01 '22 16:12 Yukimini

em其实不是他不动,而是训练时间太长了。第二个epoch大概训练了1h...看了以下代码,感觉build_iterator的时候已经把数据放到GPU里面了,但是train的时候速度还是很慢,并且查看GPU利用率只有2%,很明显是没有用上GPU。想请教一下大佬需要怎么更改代码能?

Yukimini avatar Dec 02 '22 09:12 Yukimini

已解决,是安装的torch版本不支持cuda使用

Yukimini avatar Dec 02 '22 12:12 Yukimini

已解决,是安装的torch版本不支持cuda使用

所以换成最新版本的torch就可以了吗?

hddbang avatar Dec 08 '22 06:12 hddbang

这是来自李佳颖的自动回复邮件。你好,我已收到你的邮件,祝好!

Yukimini avatar Dec 08 '22 06:12 Yukimini

已解决,是安装的torch版本不支持cuda使用

所以换成最新版本的torch就可以了吗?

是的,更换为GPU版本的Pytorch即可

Yukimini avatar Dec 12 '22 08:12 Yukimini

我想问一下为啥加载完数据以后,不进入训练

BWKevin avatar Mar 10 '23 12:03 BWKevin

这是来自李佳颖的自动回复邮件。你好,我已收到你的邮件,祝好!

Yukimini avatar Mar 10 '23 12:03 Yukimini