Results 1 comments of Xianqi Wang

你好,你的问题可能有三种原因: 1. 在不同设备上,seed即便相同初始化可能也会不同,可以尝试改一下seed; 2. 半精度混合训练虽然提高了训练速度,但只有16bit,当数据过大时,容易发生溢出,出现nan,可以尝试关闭;(在train._stereo.py第206行,把mixed_precision的default参数删除,不要把default设置为False,参数判断的是有无字符串) 3. 初始视差用的smooth_l1_loss监督,其余视差用的l1_loss监督,不同loss可能影响训练的稳定性,可以尝试都换成l1_loss。 另外,我建议可以直接加载sceneflow的预训练模型,然后在自己的数据集上训练,避免重新训练造成的不稳定。