linwaydong
Results
2
comments of
linwaydong
@YonghaoHe CE_gradient /= mx.ndarray.sum(loss_mask).asnumpy()[0] cls loss返回的是所有 loss的平均值,还是总和呢?如果求均值的话,cls loss是不是会很小?
@mifan0208 损失值大小应该没关系,只要能有一个下降趋势。