MulQG icon indicating copy to clipboard operation
MulQG copied to clipboard

IndexError: Caught IndexError in replica 0 on device 0.

Open lizhenping opened this issue 4 years ago • 6 comments

I run as the direct,but got a errot IndexError: Caught IndexError in replica 0 on device 0.

lizhenping avatar Feb 25 '21 16:02 lizhenping

any one can help me or face the same issue ,thank you.

lizhenping avatar Feb 25 '21 16:02 lizhenping

for multi gpu used , you should use pytorch 1.4,there is a bug in pytorch1.5 in nn.ParameterList when used the multi-gpu ,the nn.parameterlist will get 0, say idx out of

lizhenping avatar May 16 '21 21:05 lizhenping

经过我测试,跟查看代码,貌似压根不支持多卡。

| | @.*** | | @.*** |

---- 回复的原邮件 ---- | 发件人 | @.> | | 日期 | 2022年04月08日 21:24 | | 收件人 | @.> | | 抄送至 | @.@.> | | 主题 | Re: [HLTCHKUST/MulQG] IndexError: Caught IndexError in replica 0 on device 0. (#5) |

对于使用的多GPU,你应该使用pytorch 1.4,在nn的pytorch1.5中有一个错误。ParameterList 当使用多 GPU 时,nn.parameterlist 将得到 0,比如 idx out 你好 我多卡训练时候也出现了这个问题 。pytorch==1.71 cuda =11.0 不知道该怎么解决 ,请教

— Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you authored the thread.Message ID: @.***>

lizhenping avatar Apr 08 '22 13:04 lizhenping

经过我测试,跟查看代码,貌似压根不支持多卡。 | |@.*** | |@.*** | ... ---- 回复的原邮件 ---- | 发件人 | @.> | | 日期 | 2022年04月08日 21:24 | | 收件人 | @.> | | 抄送至 | @.@.> | | 主题 | Re: [HLTCHKUST/MulQG] IndexError: Caught IndexError in replica 0 on device 0. (#5) | 对于使用的多GPU,你应该使用pytorch 1.4,在nn的pytorch1.5中有一个错误。ParameterList 当使用多 GPU 时,nn.parameterlist 将得到 0,比如 idx out 你好 我多卡训练时候也出现了这个问题 。pytorch==1.71 cuda =11.0 不知道该怎么解决 ,请教 — Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you authored the thread.Message ID: @.***>

不好意思,我是在其他的代码中出现了这个error , google 上没有发现 解决方案

hxi667 avatar Apr 08 '22 13:04 hxi667

经过我测试,跟查看代码,貌似压根不支持多卡。 | |@.*** | |@.*** | ... ---- 回复的原邮件 ---- | 发件人 | @.> | | 日期 | 2022年04月08日 21:24 | | 收件人 | _@**._> | | 抄送至 | _@.@._> | | 主题 | Re: [HLTCHKUST/MulQG] IndexError: Caught IndexError in replica 0 on device 0. (#5) | 对于使用的多GPU,你应该使用pytorch 1.4,在nn的pytorch1.5中有一个错误。ParameterList 当使用多 GPU 时,nn.parameterlist 将得到 0,比如 idx out 你好 我多卡训练时候也出现了这个问题 。pytorch==1.71 cuda =11.0 不知道该怎么解决 ,请教 — Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you authored the thread.Message ID: _@_.*>

不好意思,我是在其他的代码中出现了这个error , google 上没有发现 解决方案

其他代码的可以通过降级解决。但是这个代码的不行,多卡不支持,多卡比较恼火,有些事发布的代码,没在多卡测试,你就算这个代码调通了,后面还有问题,我换了1.4。然后又有其它问题了。

lizhenping avatar Apr 08 '22 13:04 lizhenping

经过我测试,跟查看代码,貌似压根不支持多卡。 | |@.*** | |@.*** | ... ---- 回复的原邮件 ---- | 发件人 | @.> | | 日期 | 2022年04月08日 21:24 | | 收件人 | _@**._> | | 抄送至 | _@.@._> | | 主题 | Re: [HLTCHKUST/MulQG] IndexError: Caught IndexError in replica 0 on device 0. (#5) | 对于使用的多GPU,你应该使用pytorch 1.4,在nn的pytorch1.5中有一个错误。ParameterList 当使用多 GPU 时,nn.parameterlist 将得到 0,比如 idx out 你好 我多卡训练时候也出现了这个问题 。pytorch==1.71 cuda =11.0 不知道该怎么解决 ,请教 — Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you authored the thread.Message ID: _@_.*>

不好意思,我是在其他的代码中出现了这个error , google 上没有发现 解决方案

其他代码的可以通过降级解决。但是这个代码的不行,多卡不支持,多卡比较恼火,有些事发布的代码,没在多卡测试,你就算这个代码调通了,后面还有问题,我换了1.4。然后又有其它问题了。

我用的cuda版本是11.0.,好像只支持pytorch1.7以上,不支持1.4.。苦恼

hxi667 avatar Apr 09 '22 01:04 hxi667