Bi-Real-net
Bi-Real-net copied to clipboard
请问你们提出的“Magnitude-aware gradient with respect to weights”和xnor中有什么区别?
看起来sign的系数好像都是weight的一范数的均值
感觉没啥区别