Xiaochuan SUN

Results 6 comments of Xiaochuan SUN

Hello, may I ask if my data input size is 1280x720, or is the model adaptive to any size of image input? How did you solve this problem?

Hello, may I ask how you resolved this issue? Thank you for your reply

老师您好,这个问题我也注意到了,但我还有个问题,就是说如果我数据集分辨率是1280x720的话,我对应的关键点标注信息也是对应1280x720的,如果我对数据集原始图片进行resize变成384x288或者256x192那么我的标签如何处理,或者我在数据增强那里,对输入到网络的图片大小进行resize那么标签应该如何处理!感谢老师!恳请给个意见

老师,我这里对我的数据和标签进行了调整,都弄成了384x288的尺寸大小,但是在评估的时候使用coco的标准,coco2017人体关键点检测是17个,我这里不是17,只有8个,我在coco_eval里面做了调整还是出现这个问题,请问老师有何高见 Traceback (most recent call last): File "/media/cmf/EEA2072AA206F73D/VOS_related_Project/KeyPoint/HRNet/train_multi_GPU.py", line 272, in main(args) File "/media/cmf/EEA2072AA206F73D/VOS_related_Project/KeyPoint/HRNet/train_multi_GPU.py", line 164, in main key_info = utils.evaluate(model, data_loader_test, device=device, File "/home/cmf/anaconda3/envs/xmem-repro/lib/python3.9/site-packages/torch/utils/_contextlib.py", line 115, in decorate_context return...

> 经过model得到的视差图就是真实的视差图,但是demo_imgs.py中可视化出来的图片是经过颜色映射后的,如果你想要真实的视差图,就不要经过颜色映射了。视差图表示的是像素的偏移量,即同一个物体在左右图中的像素坐标上的差异像素,它不表示真实世界坐标。如果想要获得真实世界中的深度D,则需要通过三角转换:D=fb/d,其中f表示相机的焦距,b表示双目相机的基线距离,d表示预测的视差。2024-07-28 16:01:58>"Xiaochuan SUN" 写道: 作者您好!非常感谢您的工作和贡献!我使用在Middlebury公开数据集预训练的模型权重,直接通过demo_imgs.py对一对双目图像进行了推理预测,效果还挺好的。这里提问一个简单的问题。 推理出来的图片是视差图吗(刚接触立体匹配方面),如果我对已经推理过的双目图像对中的左目图像中的某个像素坐标获取的直接是真实世界坐标吗?如果不是,是否需要相机真实标定参数进行转化。 — Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you are subscribed to this thread.Message...

> : 您好,抱歉,还是要打扰您一下,我有个疑问如果使用np.save保存的话不是保存的视差图的.npy文件吗,我想保存.png,我这里直接`cv2.imwrite(filename,disp)` ![question](https://github.com/user-attachments/assets/d036656b-c1a4-4731-994b-a49beed869b8) 把`plt.imsave(output_directory / f"{file_stem}.png", disp.squeeze(), cmap='jet')`注释了,但是这样运行demo出现下面错误 ![question2](https://github.com/user-attachments/assets/4e1b022e-28cd-4eb6-a28e-10e1effc28a3)