lizexu123 comments

Results 15 comments of


                                            lizexu123

[Bug]: 量化llama模型导出静态模型后，无法使用静态模式推理

你跑的原生gpu还是trt推理

[Bug]: 量化llama模型导出静态模型后，无法使用静态模式推理

matmul这个算子没找到int8的实现，如果你用的paddle-trt推理，使用config.exp_disable_tensorrt_ops(["name"]) 这个name是你这个op输出的名字

[Bug]: 量化llama模型导出静态模型后，无法使用静态模式推理

你看你的运行过程中，有没有出现detected a subgraph with ***nodes

[Bug]: 量化llama模型导出静态模型后，无法使用静态模式推理

是下载的cuda相关的Paddle吗，我看matmul_kernel.cu中如果包括ifdef PADDLE_WITH_CUDA ，才支持int8

ValueError: Incorrect setting for output(s) of operator "unsqueeze2", should set: [XShape].

试一下Paddle2.5和PaddeSlim2.5呢

act 自动压缩pytorch_yolo实例中，python onnx--> tensorrt int8推理结果异常

这个[01/16/2024-03:40:10] [TRT] [E] 3: [executionContext.cpp::setBindingDimensions::1513] Error Code 3: API Usage Error (Parameter check failed at: runtime/api/executionContext.cpp::setBindingDimensions::1513, condition: engineDims.nbDims == dims.nbDims )应该是没什么影响，能跑通就没事，int8的结果正确吗

paddle_inference_eval验证性能，int8和fp32精度差距很大

用什么方法压缩的？把github链接发一下

关于Yolov5s 的qat量化问题。

可以使用PaddeSlim2.5和Paddle2.5两个版本试一下

ch_PP-OCRv3_rec_slim_infer int8量化问题

量化后的模型，不需要转，就可以在mkldnn上进行部署的

在win10系统下使用PaddleInference2.5编译ppyoloe_crn_l,出现如下问题, 请问如何解决?

已经修复了