RepOptimizers
RepOptimizers copied to clipboard
为何BN被认为在训练阶段是非线性的?
不太理解remark中所说的,BN在training-time时是非线性的。
BN要计算滑动平均和滑动方差,读论文就知道了