Option to only return the last hidden layer output from models

Open danieldk opened this issue 2 years ago • 0 comments

In many applications we only need the last layer and letting go of references to intermediate layers can save some memory during inference.

Oct 03 '23 15:10 danieldk