zhenjing comments

Results 28 comments of


                                            zhenjing

When no set MQTTVersion，Connection timeout not work, application hangs

If set MQTTVersion, then MQTTClient_connectURI API will be called one time, and Connection timeout work!

When no set MQTTVersion，Connection timeout not work, application hangs

I use MQTTClient_connectURI API to check serverURI is valid. When the serverURI is invalid, such as **10.0.0.10:1883 (host invalid)、localhsot:18803 (port invalid) and so on**, if no set MQTTVersion，connection timeout not...

鲲鹏920环境，yolov8n模型int8量化速度比默认的fp16慢了50%

版本：ncnn-20240410

鲲鹏920环境，yolov8n模型int8量化速度比默认的fp16慢了50%

**ReLU(x)=max(0,x) LeakyReLU(x)=max(αx,x)** 其中，x 是激活函数的输入，α 是一个小的正常数，通常很小（例如 0.01）。这个函数的特点是当 x 为负时，它不会直接输出零，而是输出一个很小的正比例的值 αx。这样，即使在输入为负的情况下，梯度也不会完全消失，从而帮助维持和传递一些有用的梯度信息。 **Swish函数 f(x)=x⋅σ(βx)** 其中，x 是输入，σ 是Sigmoid函数，而 β 是一个可训练的参数或者固定的常数。在最初的论文中，β 被设置为1或者作为一个可学习的参数。在多个基准测试中，Swish展示了与ReLU相比在深度学习模型中的性能优势。尤其是在深层网络和复杂任务中，Swish往往能够提供更好的准确率和收敛速度。对于使用 ReLU 和 Leaky ReLU 激活函数的模型，INT8 量化是一个有效的方法来减少模型的大小和提高推理速度，同时保持可接受的精度损失。 Swish激活函数的Sigmoid函数和乘法操作都可能在低精度下引入额外的误差。

鲲鹏920环境，yolov8n模型int8量化速度比默认的fp16慢了50%

通过配置改激活层，需重新训练 [Change activation function of YOLOv8](https://github.com/ultralytics/ultralytics/issues/7296)

鲲鹏920环境，yolov8n模型int8量化速度比默认的fp16慢了50%

激活层使用 leakyrelu ，重新训练在2并发时，fp16平均耗时100ms，int8 (opt.use_int8_inference = true) 平均耗时125ms。测试下来，鲲鹏920环境 int8量化对yolov8没效果，有副作用。

yolov8训练完成的模型转成ncnn的模型后，推理不出结果，网上查了说要进行前后处理，确实不会，能发个cpp的例子看看么！

例子1： https://github.com/Qengineering/YoloV8-ncnn-Raspberry-Pi-4 使用中间层结果，类似yolo5

yolov8训练完成的模型转成ncnn的模型后，推理不出结果，网上查了说要进行前后处理，确实不会，能发个cpp的例子看看么！

基于yolov8的最终输出，用opencv dnn库做后处理。 ` ncnn::Extractor ex = yolo.create_extractor(); ex.input("images", bgr); std::vector proposals; ncnn::Mat out; ex.extract("output", out); //std::cout

多session时(多算法) CPU计算场景，内部线程池性能比openMP线程池差50%

多session时(多算法) CPU计算场景，内部线程池性能比openMP线程池差50%

内部线程池性能优化到比openMP线程池一样或更好吗？