direct-pretraining unstable direct pre-training on Retinanet with different seeds

unstable direct pre-training on Retinanet with different seeds

Open belisarius0 opened this issue 2 years ago • 0 comments

In retinenet's direct pre-train, I observed that loss becomes nan or inf during warmup when some seeds are specified for train.py. Wrt default seed, No problem. I hope to re-explore the hyper parameters to make the learning more stable.

May 20 '22 16:05 belisarius0

direct-pretraining direct-pretraining copied to clipboard

unstable direct pre-training on Retinanet with different seeds

direct-pretraining
direct-pretraining copied to clipboard