Taco
Results
1
comments of
Taco
我解决了这个问题,因为fp16最大只支持65536在训练前十几个迭代都会overflow不会反向传播,导致没有更新这个键,你只需要把save_interval改大一点在overflow后save就可以了