How to decrease inference time of LayoutXLM?

Open piegu opened this issue 2 years ago • 0 comments

Hi,

I'm using Hugging Face libraries in order to run LayoutXLM. How can I decrease inference time? Which code to use?

I've already tested BetterTransformer (Optimum) and ONNX but none of them accepts LayoutXLM model.

BetterTransformer: NotImplementedError: The model type layoutlmv2 is not yet supported to be used with BetterTransformer.
ONNX: KeyError: "layoutlmv2 is not supported yet.

Thank you.

Note: I asked this question here, too: https://github.com/NielsRogge/Transformers-Tutorials/issues/286

Apr 30 '23 11:04 piegu