STDC-Seg 关于optimizer的问题

我发现STDC中的optimizer与BiSeNet的optimizer相比多传入了boundary_loss_func,输出看了下，请问是因为在训练过程中对初始设置的融合权重0.6,0.3,0.1进行优化吗？

Jul 15 '21 14:07 ywher

我发现STDC中的optimizer与BiSeNet的optimizer相比多传入了boundary_loss_func,输出看了下，请问是因为在训练过程中对初始设置的融合权重0.6,0.3,0.1进行优化吗？

是的，因为它里面有可训练的参数

Jul 16 '21 02:07 MichaelFan01

我发现STDC中的optimizer与BiSeNet的optimizer相比多传入了boundary_loss_func,输出看了下，请问是因为在训练过程中对初始设置的融合权重0.6,0.3,0.1进行优化吗？

是的，因为它里面有可训练的参数

thanks

Jul 16 '21 03:07 ywher

@MichaelFan01 您好，能解释一下对Detail GT采用权重优化机制的原因吗？如果直接给出精细的Detail GT与预测的Boundary计算损失结果又如何？

Jul 20 '21 09:07 chengjianhong

@MichaelFan01 您好，能解释一下对Detail GT采用权重优化机制的原因吗？如果直接给出精细的Detail GT与预测的Boundary计算损失结果又如何？

为了增加Detail信息的丰富性，直接计算也行，其实差别也不太大

Jul 21 '21 07:07 MichaelFan01

我发现STDC中的optimizer与BiSeNet的optimizer相比多传入了boundary_loss_func,输出看了下，请问是因为在训练过程中对初始设置的融合权重0.6,0.3,0.1进行优化吗？

是的，因为它里面有可训练的参数

您好，请问里面有可训练的参数是这个么？

self.fuse_kernel = torch.nn.Parameter(torch.tensor([[6./10], [3./10], [1./10]], dtype=torch.float32).reshape(1, 3, 1, 1)) .type(torch.cuda.FloatTensor))

Aug 04 '21 19:08 chenying99

我发现STDC中的optimizer与BiSeNet的optimizer相比多传入了boundary_loss_func,输出看了下，请问是因为在训练过程中对初始设置的融合权重0.6,0.3,0.1进行优化吗？

是的，因为它里面有可训练的参数

您好，请问里面有可训练的参数是这个么？

self.fuse_kernel = torch.nn.Parameter(torch.tensor([[6./10], [3./10], [1./10]], dtype=torch.float32).reshape(1, 3, 1, 1)) .type(torch.cuda.FloatTensor))

这个你当它是给定的参数就行了，因为根本没有放入计算图中。你可以打印作者和 paddleseg（借鉴原作者）训练好的模型，里面并没有 fuse_kernel这个参数。而原作者在 DDP训练时添加了 find_unused_parameters=True，所以并没有报错，它就被忽略了。

综上，文章里的 "Then we upsample the detail feature maps to theoriginal size and fuse it with a trainable1×1convolutionfor dynamic re-wegihting." 这句表述是不准确的，因为并没有被输入到计算图里训练。

Nov 01 '21 18:11 MengzhangLI

Anyway, we would support STDC-Seg on MMSegmentation for its relatively high speed and good performance on Cityscapes dataset.

FYI: https://github.com/open-mmlab/mmsegmentation/pull/995

Nov 01 '21 18:11 MengzhangLI

STDC-Seg STDC-Seg copied to clipboard

关于optimizer的问题

STDC-Seg
STDC-Seg copied to clipboard