zhenjing

Results 28 comments of zhenjing

If set MQTTVersion, then MQTTClient_connectURI API will be called one time, and Connection timeout work!

I use MQTTClient_connectURI API to check serverURI is valid. When the serverURI is invalid, such as **10.0.0.10:1883 (host invalid)、localhsot:18803 (port invalid) and so on**, if no set MQTTVersion,connection timeout not...

**ReLU(x)=max(0,x) LeakyReLU(x)=max(αx,x)** 其中,x 是激活函数的输入,α 是一个小的正常数,通常很小(例如 0.01)。这个函数的特点是当 x 为负时,它不会直接输出零,而是输出一个很小的正比例的值 αx。这样,即使在输入为负的情况下,梯度也不会完全消失,从而帮助维持和传递一些有用的梯度信息。 **Swish函数 f(x)=x⋅σ(βx)** 其中,x 是输入,σ 是Sigmoid函数,而 β 是一个可训练的参数或者固定的常数。在最初的论文中,β 被设置为1或者作为一个可学习的参数。在多个基准测试中,Swish展示了与ReLU相比在深度学习模型中的性能优势。尤其是在深层网络和复杂任务中,Swish往往能够提供更好的准确率和收敛速度。 对于使用 ReLU 和 Leaky ReLU 激活函数的模型,INT8 量化是一个有效的方法来减少模型的大小和提高推理速度,同时保持可接受的精度损失。 Swish激活函数的Sigmoid函数和乘法操作都可能在低精度下引入额外的误差。

通过配置改激活层,需重新训练 [Change activation function of YOLOv8](https://github.com/ultralytics/ultralytics/issues/7296)

激活层使用 leakyrelu ,重新训练 在2并发时,fp16平均耗时100ms,int8 (opt.use_int8_inference = true) 平均耗时125ms。 测试下来,鲲鹏920环境 int8量化对yolov8没效果,有副作用。

基于yolov8的最终输出,用opencv dnn库做后处理。 ` ncnn::Extractor ex = yolo.create_extractor(); ex.input("images", bgr); std::vector proposals; ncnn::Mat out; ex.extract("output", out); //std::cout

MNN编译选项:MNN_ARM82 测试yolov8n.mnn,使用Session API方式,共享输入图片。 鲲鹏920环境测试数据: **内部线程池:** +-------------+-----------+----------+----------+----------+--------+--------+---------------+---------------+------------+ | HandleCount | ThreadNum | AVG (ms) | Min (ms) | Max (ms) | MaxCPU | AvgCPU | MaxMemory(MB) | userTimeRatio | throughput |...

内部线程池性能优化到比openMP线程池一样或更好吗?