Knet.jl training API improvements

training API improvements

Open denizyuret opened this issue 4 years ago • 2 comments

[ ] SGD learning rate scheduler
[ ] Global gradient clip
[ ] Default to override param.opt rather than keep

Oct 23 '19 06:10 denizyuret

See also #564

Jul 25 '20 09:07 denizyuret

In the xnornet paper (https://arxiv.org/pdf/1603.05279.pdf pp. 7), LR update follows parameter update every iteration. We can generalize this to any optimizer update (maybe we want to change more than just LR) and run it every iteration. What inputs would such an update need? Iteration number? Loss values?

Mar 19 '21 06:03 denizyuret

Knet.jl Knet.jl copied to clipboard

training API improvements

Knet.jl
Knet.jl copied to clipboard