Xianqi Wang comments

Results 6 comments of


                                            Xianqi Wang

训练自己的数据集出现Nan

你好，你的问题可能有三种原因： 1. 在不同设备上，seed即便相同初始化可能也会不同，可以尝试改一下seed； 2. 半精度混合训练虽然提高了训练速度，但只有16bit，当数据过大时，容易发生溢出，出现nan，可以尝试关闭；（在train._stereo.py第206行，把mixed_precision的default参数删除，不要把default设置为False，参数判断的是有无字符串） 3. 初始视差用的smooth_l1_loss监督，其余视差用的l1_loss监督，不同loss可能影响训练的稳定性，可以尝试都换成l1_loss。另外，我建议可以直接加载sceneflow的预训练模型，然后在自己的数据集上训练，避免重新训练造成的不稳定。

Xianqi Wang

训练自己的数据集出现Nan

Export to onnx

RuntimeError: cuDNN error: CUDNN_STATUS_NOT_SUPPORTED. This error may appear if you passed in a non-contiguous input.

麻烦问问,我得怎么用模型去微调训练无标签数据?

PyTorch Correlation Block

Pre-trained models on other datasets