Chinese-CLIP
Chinese-CLIP copied to clipboard
flash attention模型转TensorRT
您好,flash attention模型方便转tensorRT进行推理吗,该怎么做呢?
您好,打开flash attention后模型是否可以转tensorRT部署我们还需要看下哈,之前确实没有测试过,有结论的话我们会尽快回复哈,也希望您也能帮我们验证下是否通。
您好,打开flash attention后模型是否可以转tensorRT部署我们还需要看下哈,之前确实没有测试过,有结论的话我们会尽快回复哈,也希望您也能帮我们验证下是否通。
请问有结论么