transformer_latent_diffusion Adding Flash attention

Adding Flash attention

Open adi-kmt opened this issue 1 year ago • 1 comments

Will improve the training and inference speed by a large margin!!

Feb 24 '24 16:02 adi-kmt

Hey the model uses https://pytorch.org/docs/stable/generated/torch.nn.functional.scaled_dot_product_attention.html which should already use flash attention.

Mar 06 '24 07:03 apapiu

transformer_latent_diffusion transformer_latent_diffusion copied to clipboard

Adding Flash attention

transformer_latent_diffusion
transformer_latent_diffusion copied to clipboard