MulQG
MulQG copied to clipboard
IndexError: Caught IndexError in replica 0 on device 0.
I run as the direct,but got a errot IndexError: Caught IndexError in replica 0 on device 0.
any one can help me or face the same issue ,thank you.
for multi gpu used , you should use pytorch 1.4,there is a bug in pytorch1.5 in nn.ParameterList when used the multi-gpu ,the nn.parameterlist will get 0, say idx out of
经过我测试,跟查看代码,貌似压根不支持多卡。
| | @.*** | | @.*** |
---- 回复的原邮件 ---- | 发件人 | @.> | | 日期 | 2022年04月08日 21:24 | | 收件人 | @.> | | 抄送至 | @.@.> | | 主题 | Re: [HLTCHKUST/MulQG] IndexError: Caught IndexError in replica 0 on device 0. (#5) |
对于使用的多GPU,你应该使用pytorch 1.4,在nn的pytorch1.5中有一个错误。ParameterList 当使用多 GPU 时,nn.parameterlist 将得到 0,比如 idx out 你好 我多卡训练时候也出现了这个问题 。pytorch==1.71 cuda =11.0 不知道该怎么解决 ,请教
— Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you authored the thread.Message ID: @.***>
经过我测试,跟查看代码,貌似压根不支持多卡。 | |@.*** | |@.*** | ... ---- 回复的原邮件 ---- | 发件人 | @.> | | 日期 | 2022年04月08日 21:24 | | 收件人 | @.> | | 抄送至 | @.@.> | | 主题 | Re: [HLTCHKUST/MulQG] IndexError: Caught IndexError in replica 0 on device 0. (#5) | 对于使用的多GPU,你应该使用pytorch 1.4,在nn的pytorch1.5中有一个错误。ParameterList 当使用多 GPU 时,nn.parameterlist 将得到 0,比如 idx out 你好 我多卡训练时候也出现了这个问题 。pytorch==1.71 cuda =11.0 不知道该怎么解决 ,请教 — Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you authored the thread.Message ID: @.***>
不好意思,我是在其他的代码中出现了这个error , google 上没有发现 解决方案
经过我测试,跟查看代码,貌似压根不支持多卡。 | |@.*** | |@.*** | ... ---- 回复的原邮件 ---- | 发件人 | @.> | | 日期 | 2022年04月08日 21:24 | | 收件人 | _@**._> | | 抄送至 | _@.@._> | | 主题 | Re: [HLTCHKUST/MulQG] IndexError: Caught IndexError in replica 0 on device 0. (#5) | 对于使用的多GPU,你应该使用pytorch 1.4,在nn的pytorch1.5中有一个错误。ParameterList 当使用多 GPU 时,nn.parameterlist 将得到 0,比如 idx out 你好 我多卡训练时候也出现了这个问题 。pytorch==1.71 cuda =11.0 不知道该怎么解决 ,请教 — Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you authored the thread.Message ID: _@_.*>
不好意思,我是在其他的代码中出现了这个error , google 上没有发现 解决方案
其他代码的可以通过降级解决。但是这个代码的不行,多卡不支持,多卡比较恼火,有些事发布的代码,没在多卡测试,你就算这个代码调通了,后面还有问题,我换了1.4。然后又有其它问题了。
经过我测试,跟查看代码,貌似压根不支持多卡。 | |@.*** | |@.*** | ... ---- 回复的原邮件 ---- | 发件人 | @.> | | 日期 | 2022年04月08日 21:24 | | 收件人 | _@**._> | | 抄送至 | _@.@._> | | 主题 | Re: [HLTCHKUST/MulQG] IndexError: Caught IndexError in replica 0 on device 0. (#5) | 对于使用的多GPU,你应该使用pytorch 1.4,在nn的pytorch1.5中有一个错误。ParameterList 当使用多 GPU 时,nn.parameterlist 将得到 0,比如 idx out 你好 我多卡训练时候也出现了这个问题 。pytorch==1.71 cuda =11.0 不知道该怎么解决 ,请教 — Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you authored the thread.Message ID: _@_.*>
不好意思,我是在其他的代码中出现了这个error , google 上没有发现 解决方案
其他代码的可以通过降级解决。但是这个代码的不行,多卡不支持,多卡比较恼火,有些事发布的代码,没在多卡测试,你就算这个代码调通了,后面还有问题,我换了1.4。然后又有其它问题了。
我用的cuda版本是11.0.,好像只支持pytorch1.7以上,不支持1.4.。苦恼