ceci3 comments

Results 66 comments of


                                            ceci3

使用自动压缩resnet18后，得到的量化模型，不能单独使用tensorRT部署

转换成onnx格式模型的话，可以直接用trt进行部署

使用自动压缩PPYOLOE，得到的模型大小和推理时间基本没有变化

请问下是使用的什么部署后端进行推理速度的测试？

请问，压缩V4检测 server模型，需要使用什么数据集？

一般使用训练数据数据就可以，另外请问下压缩方法使用的是什么？

请问，压缩V4检测 server模型，需要使用什么数据集？

请问下V4模型是什么模型，具体我怎么拿到模型？

无法复现教程中的OCR v3检测模型的量化精度

我看上一个issue的log看起来是量化训练，可以参考 https://github.com/PaddlePaddle/PaddleSlim/blob/develop/example/post_training_quantization/detection/post_quant.py#L75 这个示例使用离线量化看下效果

2024-05-30 Add FP8 PTQ

可以把不同observer的fp8量化实验结果贴上来