IGEV icon indicating copy to clipboard operation
IGEV copied to clipboard

[CVPR 2023] Iterative Geometry Encoding Volume for Stereo Matching and Multi-View Stereo

Results 31 IGEV issues
Sort by recently updated
recently updated
newest added

作者你好!我在测试模型时发现,对于同一对图像,用模型推理两次的结果有一些差异,请问是什么原因呢?是模型中有什么随机的成分吗?谢谢!

I usually switch the images (and turn 180°) and run the model a second time to get a stereo-match from right to left. This enables me to perform a consistency...

作者您好,我想咨询您一下,在这两个数据集上,您论文中的指标直接是用的Sceneflow中的预训练模型进行检测的吗?而不是混合微调以后的结果!感谢您的指导

@gangweiX 作者大大您好,我想请问一下,我应该如何将双目鱼眼的图片输入模型来预测深度呢?我如果直接采用鱼眼图片训练模型是否可行?还是说我需要做鱼眼模型和针孔模型的映射?

前向时遇到这行报错,https://github.com/gangweiX/IGEV/blob/main/IGEV-Stereo/core/utils/utils.py#L68 ```text assert torch.unique(ygrid).numel() == 1 and H == 1 # This is a stereo problem AssertionError ``` 触发了这个assert,我看作者标注了`this is a stereo problem`,请问是什么问题呢?又要怎么解决呢

每次在训练到接近8K iterations的时候都会出现loss为Nan的情况,数据集里有自己业务的数据。 ![nan](https://github.com/gangweiX/IGEV/assets/58938020/a2d87b01-29a8-4efe-833d-53c201b728d6)

我看论文中似乎并没有提到要在这两个数据集上微调,但是只在scene flow上训练达不到论文的效果,而且作者的预训练模型就有ETH3d和Middlebury的,所以我想应该要在这两个数据集上微调,具体微调多少代?

Using IGEV I need to finetune the model on my own dataset. What should be the steps I should follow in order to execute the fine-tuning because there is no...

EPE和D1非常小 @@@@在自己数据集上训练,是过拟合了吗? ![image](https://github.com/gangweiX/IGEV/assets/104683713/e509b4f9-8310-44f8-b5c1-b006a43af617)

从预训练模型到微调的成本并不高,几个小时。但是在仿真数据集的训练一次,起码要耗时4天。 您在设计实验的时候有没有考虑一些降低实验成本的方法? 我在您的提问回答中看到,没有尝试直接在KITTI上进行训练。所以想了解下您是否尝试去降低训练成本,毕竟小一周才能看一次的话,实验很难推进下去。 也许是分割了数据集中的一小部分,作为一个基准,最后全部跑一次。如果是这样,恳请您能详细说下划分的方式和基准的参数。 也许是先依照不到200K的迭代次数,作为一个基准。如果是这样,也想请您详细述说。 这些都是我的一些猜测,因为我不太敢想想八卡服务器或者是好几台服务器混合做实验(贫穷限制了想象)。