sunzhaoyang1

Results 4 comments of sunzhaoyang1

> embedding的话,负样本数量是train_group_size*batch_size-1 就是说在计算loss的时候, anchor pos neg 其中neg中元素的数量是(train_group_size*batch_size-1)对吗?

> 是的 非常感谢您的回复,以及我发现进行梯度累积的运算速度似乎比不进行梯度累积要快,batch size的大小是否有一些选择的依据?