textClassifier
textClassifier copied to clipboard
大佬有没尝试gradient checkpoint+Nvidia Apex联合使用的效果?
另外,BatchNorm2d这种操作在gradient checkpoint中会不会因为丢失历史状态而有不一致的影响?