Jiazhong Cen
Jiazhong Cen
sam masks下的文件是使用extact sam masks 脚本进行的。 这里的错误是由于downsample处理后的文件名和原始文件名没有对应导致的,需要建立原始文件名(即IMG_4026)到降采样后文件名(imagexxx)的映射。这里一般是按照数字大小自动排序的,因此sort一下然后对应起文件名就可以了。 或者你可以在提取sam mask的时候加上参数:--downsample_type mask 这会阻止脚本使用提前降采样准备好的文件名未对齐的文件进行掩膜提取,转而使用原始分辨率图像进行提取并随后进行掩膜降采样。请注意,这可能会导致显存不足问题。
> 我只需要将image000.pt-image019.pt文件按顺序更名为IMG_4026.pt-IMG_4045.pt文件就可以当作feature使用了吗? 是的,确保图像是对应的
看上去是H和W反了?我们没有遇到过这种问题,请多提供一些程序中间变量的输出结果,例如张量尺寸等帮助定位问题
Thanks @Luca-Wiehe for the help!
Hi, > Is it possible to load a pre-trained 3D Gaussian splatting (.ply) model from Nerfstudio and perform semantic segmentation on it? In fact I don't know the data structure...
In this file is a **binary** torch tensor with size N_G, where N_G denotes the number of 3D Gaussians in the 3D-GS model.
Hi, thanks for your interest! The obtained assets are 3D Gaussians. Before segmentation beginning, we need to pre-train a [3D-GS](https://github.com/graphdeco-inria/gaussian-splatting) model. After segmentation, the segmented target can be viewed from...
你需要查看存在模型中的[mask grid](https://github.com/Jumpat/SegmentAnythingin3D/blob/b25698cbc7ca8e71b73749685b36f2914d6cbee7/lib/seg_dvgo.py#L64)变量,这一变量是一个3D voxel grid,分割结束后可以从这个grid中提取bounding box信息
看起来LLFF数据集的官方链接权限失效了,你可能需要从互联网上搜索其他渠道分享的llff链接。npy文件是通过使用llff官方code中的脚本,将colmap的处理结果转换得到的。
This roots in data distribution. SAM tends to segment the camera into multiple parts, and thus the learned affinity features inherit this trait.