nyjshinibaba

Results 11 comments of nyjshinibaba

@lambertwx @dongzhang89 作者你们好,可能是没有@导致你们没有看到这条提问,我也有相同的问题,请问这个代码的循环部分是怎么跑起来的,我在代码中只看到了产生伪掩码和分割模型训练两个部分单独的,但是整个框架的运行没找到,您知道如何解决吗????

还有一个问题:这篇论文code中的因果干预部分对应在哪个部分?如果可以回答的话,万分感激

> 请问你的问题已经解决了吗? @Mugen-chen 你好,我也是研究因果和cv结合的,这个问题我还没解决,可以加个联系方式,讨论

混杂集的注释和数据分区这两部分在代码中如何体现的

@Wangt-CN 如果您看到这个提问能回复的话,万分感激,因为想基于大佬的工作做些拓展

@Chengnotwang 兄弟我今天也遇到这个问题了,估计是他们库的bug,服务器重启之后,resume那个pth就卡在这一步了

@chhluo @Chengnotwang 据我仔细阅读代码,应该是保存的原因,resume只能支持epoch保存的pth,而不支持iter保存的权重,将checkpointhook的初始化参数加上by_epoch=True,这样就是以iter训练,但是保存权重是按照epoch保存的,这个应该可以resume,但是iter因为无法记录最后的iter所在的epoch已经训练过哪些batch包含的数据,或者说这是个bug还没解决,所以iter.pth在resume的时候会因为无法完整加载或者识别当前epoch需要的剩余数据而卡住

@ShenZheng2000 请问你debug的前提是模型保存的是iter而不是epoch么

@ShenZheng2000 我改成这个版本的mmengine之后报错loaded state dict has a different number of parameter groups