humanrf icon indicating copy to clipboard operation
humanrf copied to clipboard

Processing for mesh

Open CCtwelve opened this issue 11 months ago • 9 comments

Hi, thank you for your outstanding work. I noticed that you mentioned using RealityCapture for reconstruction in another question. When I use RealityCapture for reconstruction, the results are not ideal. Could you demonstrate the reconstruction process using this tool?

At the same time, I used COLMAP for reconstruction, but the feature maps of the back view could not be matched with those of the front view, resulting in missing point clouds for the back. I wonder if you have encountered this situation.

Image Image Image Image

CCtwelve avatar May 13 '25 03:05 CCtwelve

我遇到了类似的问题,人物后脑勺部分不太容易重建得很好,以及零散的黑边。我建议你可以直接用数据集中的calibration.csv真值试一下,结果看起来还可以。

zhulongcc avatar Jun 23 '25 19:06 zhulongcc

我遇到了类似的问题,人物后脑勺部分不太容易重建得很好,以及零散的黑边。我建议你可以直接用数据集中的calibration.csv真值试一下,结果看起来还可以。

160个视角的通过调整colmap参数 可以到达很好的效果,比使用calibration.csv效果要好很多,但是我尝试15个视角的,效果还是不太好

CCtwelve avatar Jun 24 '25 05:06 CCtwelve

我遇到了类似的问题,人物后脑勺部分不太容易重建得很好,以及零散的黑边。我建议你可以直接用数据集中的calibration.csv真值试一下,结果看起来还可以。

160个视角的通过调整colmap参数 可以到达很好的效果,比使用calibration.csv效果要好很多,但是我尝试15个视角的,效果还是不太好

我试了一下用160张图colmap重建,发现确实比使用calibration.csv的效果要好。有点疑惑,按理说calibration.csv给出的是相机内外参真值,重建效果不应该比colmap估计的结果要差。我比较了几张图的内外参真值 (calibration中的) 和cameras.txt&images.txt (colmap中的) 数值,还是有差别的。是因为calibration.csv提供的内外参的误差比较大吗,我不太确定这个推断对不对。

Image

还有你用160张图重建时,改动了哪些colmap参数呢?如果用15个视角来重建的话,图片数量太少,效果应该不会很好。

zhulongcc avatar Jun 24 '25 09:06 zhulongcc

我遇到了类似的问题,人物后脑勺部分不太容易重建得很好,以及零散的黑边。我建议你可以直接用数据集中的calibration.csv真值试一下,结果看起来还可以。

160个视角的通过调整colmap参数 可以到达很好的效果,比使用calibration.csv效果要好很多,但是我尝试15个视角的,效果还是不太好

我试了一下用160张图colmap重建,发现确实比使用calibration.csv的效果要好。有点疑惑,按理说calibration.csv给出的是相机内外参真值,重建效果不应该比colmap估计的结果要差。我比较了几张图的内外参真值 (calibration中的) 和cameras.txt&images.txt (colmap中的) 数值,还是有差别的。是因为calibration.csv提供的内外参的误差比较大吗,我不太确定这个推断对不对。

Image

还有你用160张图重建时,改动了哪些colmap参数呢?如果用15个视角来重建的话,图片数量太少,效果应该不会很好。

我也不确定,是不是因为内外参数的问题还是因为colmap本身的问题, 我是用使用gui看了一下相机的布局,没有明显的错误。 另外,我修改了很多的参数主要是特征提取和mapper的参数。 我觉得是gs的问题,colmap我的结果还算满意

CCtwelve avatar Jun 24 '25 14:06 CCtwelve

我得到了一个有好有坏的结果。3dgs重建的正面看起来还不错,但是头部后面、上面,以及肩膀就很糟糕了。

Image

Image

这个结果比calibration.csv重建的结果要好很多,但只用到了95张左右的图片,其余的图片被colmap舍弃掉了。

zhulongcc avatar Jun 24 '25 14:06 zhulongcc

那不应该,我建议你调整一下colmap的参数,--ImageReader.single_camera 0 --ImageReader.camera_model PINHOLE --SiftExtraction.peak_threshold 0.001 --SiftExtraction.edge_threshold 80

CCtwelve avatar Jun 24 '25 15:06 CCtwelve

那不应该,我建议你调整一下colmap的参数,--ImageReader.single_camera 0 --ImageReader.camera_model PINHOLE --SiftExtraction.peak_threshold 0.001 --SiftExtraction.edge_threshold 80

谢谢你给的参数,现在colmap可以用到158张图以及得到3万多个点了。

Image

但是我再继续缩小peak_threshold或者增大edge_threshold,或者修改recons truction options参数,仍然不能用上全部160张图。(强迫症难受>.< 另外,对比可视化结果,你的图中点云结果还要更稠密一些。所以我想再请教一下,还需要修改哪些参数才能达到跟你的结果类似的效果呢?

zhulongcc avatar Jun 24 '25 20:06 zhulongcc

那不应该,我建议你调整一下colmap的参数,--ImageReader.single_camera 0 --ImageReader.camera_model PINHOLE --SiftExtraction.peak_threshold 0.001 --SiftExtraction.edge_threshold 80

谢谢你给的参数,现在colmap可以用到158张图以及得到3万多个点了。

Image

但是我再继续缩小peak_threshold或者增大edge_threshold,或者修改recons truction options参数,仍然不能用上全部160张图。(强迫症难受>.< 另外,对比可视化结果,你的图中点云结果还要更稠密一些。所以我想再请教一下,还需要修改哪些参数才能达到跟你的结果类似的效果呢?

或许你可以尝试一下添加--SiftMatching.guided_matching 1 ,你这个是应该不是stereo_fusion之后的结果吧,看起来很稀疏

CCtwelve avatar Jun 25 '25 05:06 CCtwelve

那不应该,我建议你调整一下colmap的参数,--ImageReader.single_camera 0 --ImageReader.camera_model PINHOLE --SiftExtraction.peak_threshold 0.001 --SiftExtraction.edge_threshold 80

谢谢你给的参数,现在colmap可以用到158张图以及得到3万多个点了。 Image 但是我再继续缩小peak_threshold或者增大edge_threshold,或者修改recons truction options参数,仍然不能用上全部160张图。(强迫症难受>.< 另外,对比可视化结果,你的图中点云结果还要更稠密一些。所以我想再请教一下,还需要修改哪些参数才能达到跟你的结果类似的效果呢?

或许你可以尝试一下添加--SiftMatching.guided_matching 1 ,你这个是应该不是stereo_fusion之后的结果吧,看起来很稀疏

是的,我没有做稠密重建,只用了稀疏重建。我试了下guided_matching,发现结果确实变好了。太感谢你的指点了~

zhulongcc avatar Jun 25 '25 11:06 zhulongcc

If you look at the camera positions on the colmap, you'll notice that all the cameras are positioned facing forward. I suspect that the skirt's single color and limited features lead to poor feature matching, causing many cameras to fail.

ZJun96 avatar Dec 01 '25 12:12 ZJun96

If you look at the camera positions on the colmap, you'll notice that all the cameras are positioned facing forward. I suspect that the skirt's single color and limited features lead to poor feature matching, causing many cameras to fail.

我跟你想得一样,主要还是特征提取和匹配得不行。之前我把数据集都试了一下,用colmap重建的结果都不太理想。

zhulongcc avatar Dec 01 '25 12:12 zhulongcc

If you look at the camera positions on the colmap, you'll notice that all the cameras are positioned facing forward. I suspect that the skirt's single color and limited features lead to poor feature matching, causing many cameras to fail.

我跟你想得一样,主要还是特征提取和匹配得不行。之前我把数据集都试了一下,用colmap重建的结果都不太理想。

用nerfstudio效果很好

CCtwelve avatar Dec 01 '25 12:12 CCtwelve

If you look at the camera positions on the colmap, you'll notice that all the cameras are positioned facing forward. I suspect that the skirt's single color and limited features lead to poor feature matching, causing many cameras to fail.

我跟你想得一样,主要还是特征提取和匹配得不行。之前我把数据集都试了一下,用colmap重建的结果都不太理想。

用nerfstudio效果很好

谢谢提醒~nerfstudio是用nerf类的方法来重建的吧。我是用colmap稀疏重建好再用3DGS重建的,但是colmap这一步很难把这个数据集的所有视角图片都匹配上。

zhulongcc avatar Dec 01 '25 12:12 zhulongcc