cjf-lemon
cjf-lemon
> Hi, during training, we use a soft activation map (1-pk) to mask out background regions, i.e., (1-pk) * x. With the L_BTM loss, pk will be optimized to only...
> Exactly. p should be normalized into [0,1] by sigmoid. Btw, welcome to star CLIMS. :) Thank you! I have starred CLIMS.
> sam能通过直接给text提示,得到mask了吗? 用到了clip,https://github.com/maxi-w/CLIP-SAM
> GroundingDINO可以根据texts得到一个很好的先验box,然后使用sam得到精细的mask,是一个组合式的方案,比较高效 这里面能实现不人工给提示,并且不用chatgpt,然后就能对图像中所有的东西做分割且进行类别标注吗?
> 不人工提示的话可以尝试走我们这边BLIP那套pipeline,也有对应的Demo,可以自动标注,可以看看这个demo: https://github.com/IDEA-Research/Grounded-Segment-Anything/blob/main/automatic_label_demo.py 我运行的gradio_app.py选择seg的时候,这里到5s左右就直接显示error,但是代码是没有报错,并且运行到了最后的return [image, mask_pil]这一步,而我单独运行grounded_sam_demo.py是可以出来结果的,是我哪里需要修改吗,网页上没有显示出结果 