Results 338 comments of jxt1234

1. precision 设成 normal 试下 2. MNN 是最新代码么?相关模型发我们看看

1. 更新 mnn 代码到最新 2. 用 MNNV2Basic.out 在 Android 上面测试看看 https://mnn-docs.readthedocs.io/en/latest/tools/test.html

更新最新代码测试吧

目前 CUDA 不支持加上 --transformerFuse 转换的 LLM 模型,如需使用 cuda 运行 LLM,在转换模型时不要加这项

safetensors 没有模型结构,无法转化。导出 onnx 或者 torchscript 再转 mnn

内部代码修正,近期同步