IEBins
IEBins copied to clipboard
[NeurIPS2023] IEBins: Iterative Elastic Bins for Monocular Depth Estimation
作者您好,我想使用IEBins进行单幅图像深度估计,使用了在页面开源的kittieigen_L预训练模型,出现以下报错信息: data:image/s3,"s3://crabby-images/2030d/2030d20246eb1e67032164671528d7f0625a3526" alt="f505dcd9f2fb6354ce74cbcbeaec184" 我想请问这是否是由于对于单幅图像推理需要固定图像的输入分辨率,如果是的话输入图像的分辨率是多少。
作者您好,想请问一下 NYU 数据集里的 dense png是怎么获取的? 找了好久都没弄明白。 例如 `nyudepthv2_train_files_with_gt_dense.txt` 文件里面的 `xxx/sync_depth_dense_00000.png` ```py bedroom_0130/rgb_00000.jpg bedroom_0130/sync_depth_00000.png bedroom_0130/dense/sync_depth_dense_00000.png bedroom_0130/rgb_00001.jpg bedroom_0130/sync_depth_00001.png bedroom_0130/dense/sync_depth_dense_00001.png bedroom_0130/rgb_00002.jpg bedroom_0130/sync_depth_00002.png bedroom_0130/dense/sync_depth_dense_00002.png bedroom_0130/rgb_00003.jpg bedroom_0130/sync_depth_00003.png bedroom_0130/dense/sync_depth_dense_00003.png ``` 谢谢!
作者您好,目前在复现您的工作,我用的不是kitti和nyu数据集,用的是清华大学发布的dair数据集,里面也有激光雷达点云图和rgb图片,图片的分辨率大小是在1920*1080,但由于本人目前计算资源不够,所以全尺寸跑的话batch_size只能设为2,训练过程中大约100次左右的iteration后就loss就不变了大约在1点几左右,于是我将图片resize了一下,现在尺寸为960*448,batch_size为8,但loss就变成了30多。想向您请教俩个问题 1.您之前训练kitti的时候有对深度图进行resize吗? 2.对于我这种情况您是建议寻找更好的计算资源还是去调整loss